Аналіз срачегенеруючих постів у Твітері (Х)

В якись день я подумав, що у твітері всі срачі ходять по колу, і стало цікаво спробувати порахувати їх по категоріях, та подивитись, чи стало їх більше!

Я згадав, що у твітері є прекрасний акаунт – @sho_po_ukrtwi, який займається агрегацією всіх срачів, і це наче те, що треба!

Як збирались дані

Я експортнув всі твіти цього акаунта (на жаль, через обмеження твітера вийшло завантажити лише 1200 останніх твітів) та прибрав деякі нерелевантні твіти (зі зборами та які не повʼязані зі срачами). Так як більшість твітів включають в собі скріншоти інших твітів, тому додатково gpt мені додатково витягнув тексти з кожного зображення – вони допомогатимуть далі зрозуміти контекст твіта.

Далі треба було обрати категорії – я з голови обрав 17 категорій! Туди потрапила політична поляризація, війна, фінансові питання, їжа, вчителі, нерівність, айтівці, мовне питання, росіяни, соціальна сегрегація, глузування, відносини, спорт, держава, трансгендери, сфера обслуговування та архітектура. Після декількох ітерацій, я поекспериментував з промптами, і більш-менш gpt почав добре їх розпізнавати.

Коли gpt закінчив роботу, я поліз зразу дивитись на графіки! Звісно, що глузування в рази зібрало більше всіх інших (це і не дивно)! Далі йдуть срачі теми про відносини та навколовоєнні.

На всі процедури (розпізнавання зображень та 3 інтерації обробки всіх твітів) пішло близько 6 долярів.

Приклади срачів

Дуже сподобалось, як llm змогла розпізнати категорії прямо за твітами, описом зображень та текстами оригінальних твітів (якщо це був ретвіт з коментарем). Часто в твіті не було опису, що обговорювалось (але більшість всього була саме в зображеннях) – розпізнавати графічний контент (хоча там просто знаходився додатковий текст) виявилось дуже гарною ідеєю!

Наприклад, рандомні срачі про спорт:

Рубрика "скандал на Олімпіаді". Під час жіночого боксерського поєдинку італійська боксерка на 40 секунді зупинила бій зі словами: "це несправедливо!" проти алжирської суперниці Імане Хеліф. https://t.co/qXJ8uQDJdV
Блекаут у Іспанії та Португалії підняв дискусію навколо доречності жартів на цю тему. З одного боку, згадується допомога цих країн у війні. З іншого - хтось пригадує поведінку єврофанів, які лили багато бруду через поразку учасниці від Іспанії Шанель на Євробаченні 2022 😵‍💫 https://t.co/nPP4ZhuJBB
Про гроші на спорт https://t.co/vFxBLmjoxo
Уходиш? https://t.co/A2KCLJ8dEo
Важливе уточнення. Якщо ви досі не заплуталися, то інформація про XY-хромосому виглядає як руснявий нахрюк з Телеграму, у якого поки не знайшлося інших підтверджень... Ми з цією новиною вже здуріли, розбирайтесь далі самі, бо ми задовбалися спростовувати спростування 🤣 https://t.co/IkdAzLm89x
З Олімпіади завірусилось фото Юсуфа Дікеча, який виступав за Туреччину у стрільбі з пістолета, виглядаючи як "звичайний дядько з вулиці" без будь-яких хай-текових інструментів на кшталт окулярів та навушників і виборов при цьому срібло! https://t.co/DzouMs7Q47
Пані Ярослава лягла перепочити між спробами. Ось це поки ніби найкращий комент (а також пояснення самої Ярослави з інтерв'ю): https://t.co/Aui9tV49D3
Більше деталей про спортсмена можна прочитати тут: https://t.co/27KOmSXc7x
Про Оземпік несеться звідси (хоча і не тільки, взагалі про нього стали говорити останні кілька днів). Для тих, хто поза контекстом - це препарат для схуднення. Його критикують через те, що він має багато побічок і треба ретельно консультуватися з лікарями. https://t.co/tJ34hI5BMw

Або айті-срачі!

Гаряча тема з купою цікавих відповідей https://t.co/NkFpwoSxex
Зберігаю для історії: Антивірус компанії CrowdStrike поламав купу комп'ютерів при оновленні, викликаючи у Windows "синій екран смерті". Це зачепило роботу багатьох банків, аеропортів etc. по всьому світу. Так, ми теж ніколи до цього не чули про цю компанію і її застосунки 😅 https://t.co/dY7t0L9GiJ
Для підсумків року: https://t.co/uyOuoMdjuM
Згадки про флешку 🫠 https://t.co/NGcQnXSSl7
Почитати можна тут: https://t.co/5xz0ySZcRW
Про заробіток у парі/сім'ї https://t.co/X1i8op2NHb
Не заливати на прод в п'ятницю! Це правило написано розумними людьми 😁 https://t.co/AzRlT93aSb
Про пошуки роботи, коли людина тільки недавно стала повнолітньою https://t.co/oZcpRIU5Cf
Російського мільярдера та засновника Telegram Павла Дурова затримали французькі спецслужби в аеропорту Ле-Бурже. Як повідомив телеканал TF1, це сталося близько 20:00 за місцевим часом. Дуров прибув до Франції з Азербайджану на власному приватному літаку. Заявляється, що представники спецслужб мали ордер на його арешт.
Заробляти можна не тільки в IT :) Давайте мені нішу, а я вам напишу як можна заробляти в цьому секторі (1к$+) (Спойлєр: треба буде напрягтись і щось робити екстра з того, що ви вже робите, або робити по-іншому) П.с.Ця порада не змінить індустрію, може тільки ваше благополуччя
Жінки всі якоюсь мірою програмістки, виходить... https://t.co/yGLVtYcBqw
Про сир у Сільпо та касирів, які відкладають собі товари за знижкою - звідси https://t.co/oyyBBRJzhB
Черговий срач про зарплати в айтішечці - звідси https://t.co/Orkx60ISk8

Маючи інформацію про кількість сентиментів та дати твітів, можна ще зробити теплову карту з помісячною розбивкою!

Виглядає, що срачогенеруючий період – це літо 24-го року!