Аналіз срачегенеруючих постів у Твітері (Х)

В якись день я подумав, що у твітері всі срачі ходять по колу, і стало цікаво спробувати порахувати їх по категоріях, та подивитись, чи стало їх більше!
Я згадав, що у твітері є прекрасний акаунт – @sho_po_ukrtwi, який займається агрегацією всіх срачів, і це наче те, що треба!
Як збирались дані
Я експортнув всі твіти цього акаунта (на жаль, через обмеження твітера вийшло завантажити лише 1200 останніх твітів) та прибрав деякі нерелевантні твіти (зі зборами та які не повʼязані зі срачами). Так як більшість твітів включають в собі скріншоти інших твітів, тому додатково gpt мені додатково витягнув тексти з кожного зображення – вони допомогатимуть далі зрозуміти контекст твіта.
Далі треба було обрати категорії – я з голови обрав 17 категорій! Туди потрапила політична поляризація, війна, фінансові питання, їжа, вчителі, нерівність, айтівці, мовне питання, росіяни, соціальна сегрегація, глузування, відносини, спорт, держава, трансгендери, сфера обслуговування та архітектура. Після декількох ітерацій, я поекспериментував з промптами, і більш-менш gpt почав добре їх розпізнавати.
Коли gpt закінчив роботу, я поліз зразу дивитись на графіки! Звісно, що глузування в рази зібрало більше всіх інших (це і не дивно)! Далі йдуть срачі теми про відносини та навколовоєнні.

На всі процедури (розпізнавання зображень та 3 інтерації обробки всіх твітів) пішло близько 6 долярів.
Приклади срачів
Дуже сподобалось, як llm змогла розпізнати категорії прямо за твітами, описом зображень та текстами оригінальних твітів (якщо це був ретвіт з коментарем). Часто в твіті не було опису, що обговорювалось (але більшість всього була саме в зображеннях) – розпізнавати графічний контент (хоча там просто знаходився додатковий текст) виявилось дуже гарною ідеєю!
Наприклад, рандомні срачі про спорт:
Рубрика "скандал на Олімпіаді". Під час жіночого боксерського поєдинку італійська боксерка на 40 секунді зупинила бій зі словами: "це несправедливо!" проти алжирської суперниці Імане Хеліф. https://t.co/qXJ8uQDJdV |
Блекаут у Іспанії та Португалії підняв дискусію навколо доречності жартів на цю тему. З одного боку, згадується допомога цих країн у війні. З іншого - хтось пригадує поведінку єврофанів, які лили багато бруду через поразку учасниці від Іспанії Шанель на Євробаченні 2022 😵💫 https://t.co/nPP4ZhuJBB |
Про гроші на спорт https://t.co/vFxBLmjoxo |
Уходиш? https://t.co/A2KCLJ8dEo |
Важливе уточнення. Якщо ви досі не заплуталися, то інформація про XY-хромосому виглядає як руснявий нахрюк з Телеграму, у якого поки не знайшлося інших підтверджень... Ми з цією новиною вже здуріли, розбирайтесь далі самі, бо ми задовбалися спростовувати спростування 🤣 https://t.co/IkdAzLm89x |
З Олімпіади завірусилось фото Юсуфа Дікеча, який виступав за Туреччину у стрільбі з пістолета, виглядаючи як "звичайний дядько з вулиці" без будь-яких хай-текових інструментів на кшталт окулярів та навушників і виборов при цьому срібло! https://t.co/DzouMs7Q47 |
Пані Ярослава лягла перепочити між спробами. Ось це поки ніби найкращий комент (а також пояснення самої Ярослави з інтерв'ю): https://t.co/Aui9tV49D3 |
Більше деталей про спортсмена можна прочитати тут: https://t.co/27KOmSXc7x |
Про Оземпік несеться звідси (хоча і не тільки, взагалі про нього стали говорити останні кілька днів). Для тих, хто поза контекстом - це препарат для схуднення. Його критикують через те, що він має багато побічок і треба ретельно консультуватися з лікарями. https://t.co/tJ34hI5BMw |
Або айті-срачі!
Гаряча тема з купою цікавих відповідей https://t.co/NkFpwoSxex |
Зберігаю для історії: Антивірус компанії CrowdStrike поламав купу комп'ютерів при оновленні, викликаючи у Windows "синій екран смерті". Це зачепило роботу багатьох банків, аеропортів etc. по всьому світу. Так, ми теж ніколи до цього не чули про цю компанію і її застосунки 😅 https://t.co/dY7t0L9GiJ |
Для підсумків року: https://t.co/uyOuoMdjuM |
Згадки про флешку 🫠 https://t.co/NGcQnXSSl7 |
Почитати можна тут: https://t.co/5xz0ySZcRW |
Про заробіток у парі/сім'ї https://t.co/X1i8op2NHb |
Не заливати на прод в п'ятницю! Це правило написано розумними людьми 😁 https://t.co/AzRlT93aSb |
Про пошуки роботи, коли людина тільки недавно стала повнолітньою https://t.co/oZcpRIU5Cf |
Російського мільярдера та засновника Telegram Павла Дурова затримали французькі спецслужби в аеропорту Ле-Бурже. Як повідомив телеканал TF1, це сталося близько 20:00 за місцевим часом. Дуров прибув до Франції з Азербайджану на власному приватному літаку. Заявляється, що представники спецслужб мали ордер на його арешт. |
Заробляти можна не тільки в IT :) Давайте мені нішу, а я вам напишу як можна заробляти в цьому секторі (1к$+) (Спойлєр: треба буде напрягтись і щось робити екстра з того, що ви вже робите, або робити по-іншому) П.с.Ця порада не змінить індустрію, може тільки ваше благополуччя |
Жінки всі якоюсь мірою програмістки, виходить... https://t.co/yGLVtYcBqw |
Про сир у Сільпо та касирів, які відкладають собі товари за знижкою - звідси https://t.co/oyyBBRJzhB |
Черговий срач про зарплати в айтішечці - звідси https://t.co/Orkx60ISk8 |
Маючи інформацію про кількість сентиментів та дати твітів, можна ще зробити теплову карту з помісячною розбивкою!

Виглядає, що срачогенеруючий період – це літо 24-го року!
