Найпопулярніші слова, використані в соціальних мережах

Ви коли-небудь задавались питанням про мову, яка використовується в соціальних мережах? Або woexrds, які ми використовуємо, базуються на наших рисах особистості? Якщо ваша відповідь так, вам пощастило.

Передумови

Центр позитивної психології базується в Університеті Пенсільванії створив те, що відоме як Світовий проект добробуту (WWBP). Цей дивовижний проект формує наукові методи, вимірюючи психологічний добробут та фізичне здоров’я на основі аналізу мови в соціальних мережах. Найяскравіші комп’ютерні вчені, психологи та статистики збирають голову на психосоціальні процеси, що впливають на здоров’я та щастя, і вивчають потенціал заміни дорогих методів опитування. У 2013 році WWBP опублікував дослідження під назвою Особистість, стать та вік мовою соціальних медіа: підхід з відкритим словником. В одному з найбільших досліджень на сьогодні WWBP проаналізував понад 700 мільйонів слів, фраз та тематичних прикладів, зібраних із повідомлень 75 000 добровольців у Facebook. Для аналізу повідомлень вони використовували два різні методи для пошуку демографічних та психологічних ознак:

  • Диференціальний мовний аналіз (DLA): метод, розроблений WWBP для виявлення найбільш відмінних мовних особливостей від будь-якого даного атрибута.
  • Мовне дослідження та підрахунок слів (LIWC): популярний інструмент, що використовується в психології для пошуку способів використання людей у ​​своєму повсякденному житті. Це може надати багату інформацію про їх переконання, страхи, моделі мислення, соціальні стосунки та особистості.

У цьому конкретному дослідженні WWBP також пропонував добровольцям проходити стандартні тести особистості (модель великих 5 факторів), щоб визначити слова, що використовуються в певних рисах особистості. Поєднавши все це, вони змогли зв’язати мову соціальних мереж особистості, статі та віку з точністю 91,9%. Тепер давайте забруднимо руки і подивимось, як вони збирали оновлення статусу Facebook та формулювали свої діаграми візуалізації.



Дані

Повний набір даних складався приблизно з 19 мільйонів оновлень статусу Facebook, написаних усіма учасниками. Команда WWBP обмежила свій аналіз тими користувачами Facebook, які відповідають 4 певним критеріям:

  • Вони повинні вказувати англійську мову як основну
  • Написали щонайменше 1000 слів у своїх оновленнях статусу
  • Бути до 65 років
  • Вкажіть стать (чоловіки та жінки) та вік

Мова статі:

мова соціальних мереж

Особливості жіночої мови показані зверху, а нижченаведені особливості чоловічої мови. S ізе слова вказує на силу кореляції; Колір вказує на відносну частоту використання. Підкреслення (_) зв’язати слова багатослівних фраз.



  • Самки у цьому дослідженні (Top) використано більше слів емоцій (наприклад, схвильований) та однини від першої особи, і вони згадують більше психологічних та соціальних процесів (наприклад, 'люблю тебе' та '<3’ –a heart).
  • Хвороби використовував більше лайливих слів та посилань на об’єкти (наприклад, „xbox“, „black ops“, „бажає він“).

Мова віку:

мова соціальних мереж

Як ви можете бачити на малюнку 3 вище, є незначні зміни тем, які переходять від однієї вікової групи до іншої. Крім того, існують чіткі відмінності в таких словах, як використання сленгу, смайликів та Інтернету Вікова група від 13 до 18 років . В Вікова група від 23 до 29 років , можна побачити пару Інтернет говорить або робочі теми (наприклад, «на роботі», «нова робота»). Ми бачимо a школа відповідна тема для Віком від 13 до 18 років (наприклад, 'школа', 'домашнє завдання', 'тьфу'), тоді як ми бачимо a коледж відповідна тема для Від 19 до 22 років (наприклад, «семестр», «коледж», «реєстр»). У міру просування до Вікова група від 30 до 65 років , вживані слова орієнтовані більше на емоційну стабільність з родиною та друзями (наприклад, «дочка», «мій син», «мої діти» та «мої друзі fb»). Загалом, ви побачите розвиток школи, коледжу, роботи та сім’ї, розглядаючи основні теми всіх вікових груп.



Стандартна частота тем і слів за віком: мова соціальних мереж

В , графік показує відносну частоту найбільш виборчих тем для кожної вікової групи як функцію віку. Рис. 4B підсилює цю гіпотезу, представляючи подібний зразок, заснований на інших соціальних темах. Рис. 4C показує, що вживання «ми» зростає після 22 років, тоді як «Я» зменшується. Це, безумовно, свідчить про зростаючу важливість дружби та стосунків із віком людей.



Мова особистості:

Дослідники дослідили, як наша мова та особистість збігаються. Вони проаналізували слова, які використовували учасники, та організували їх, виходячи з особистості кожного учасника. Ось коротке оновлення 5 факторів особистості:

  • Екстраверсія: описує, як ви взаємодієте з людьми.
  • Невротизм: це спосіб боротьби з емоціями
  • Погодливість: це те, як ти почуваєшся до інших
  • Добросовісність: описує, наскільки ви організовані та надійні
  • Відкритість: це коли хтось цікавий і відкритий до нових вражень та знань
мова соціальних мереж мова соціальних мереж

У верхньому лівому куті ми бачимо, як такі соціально пов’язані категорії вечірка теми постають як ключова відмінна риса для Екстраверти . Крім того, результати свідчать про те, що Інтроверти цікавляться японськими ЗМІ (наприклад, аніме, манга, Інтернет та смайлики в японському стилі: ˆ_ˆ). Зліва внизу на малюнку 5 показано, що люди Високий рівень невротизму загальновизнані фрази, такі як «хворий на», «пригнічений» та «ненавиджу». У нижньому правому куті показано мову, пов’язану з емоційною стабільністю ( Низький невротизм ). Низьконевротичний люди писали про приємну соціальну діяльність, яка сприяє гармонії або створює більший емоційний баланс, наприклад, „спорт”, „відпустка”, „пляж”, „церква”, „команда” та сімейний час теми. На рисунку 6 нижче (праворуч унизу), люди, які відображають Низька відкритість використовуйте скорочені слова для оновлення їх статусу (наприклад, „2 дні“, „ур“, „кожні 1“). Люди, які є Високо відкритий (унизу ліворуч) використовуються творчі слова (наприклад, 'мистецтво', 'всесвіт', 'музика', 'письмо' та 'душа'). Ви можете не резонувати з цим, але Низька добросовісність люди (середній лівий) використовують в своїх оновленнях дуже явні слова, тоді як Висока добросовісність люди (середній лівий) використовують фрази (наприклад, 'працювати', 'готовий до' та 'великий день'). Як бачите, соціальні медіа-платформи, такі як Facebook та Twitter, є дуже сприятливими ресурсами для вивчення людей; оновлення статусу та твіти мають виразний, особистий характер та мають емоційний зміст. Запам’ятайте кілька речей:



  • Ця мова, як правило, є неупередженою і є вимірюваними даними про поведінку
  • Мова Facebook спеціально дозволяє дослідникам спостерігати за людьми, коли вони представляють своє справжнє «Я» в Інтернеті.

ДО Методу

Фігура 1



Як ви можете бачити з рисунка 1 вище, DLA працює: 1.) Вилучення функцій: Вилучення мови за: (а) слова та фрази : послідовність від 1 до 3 слів, знайдених у рядку тексту, смайликів та двох або більше слів, що відповідають якомусь загальноприйнятому способу висловлювання. (б) теми : автоматичний аналіз великих колекцій немаркованого тексту. 2.) Кореляційний аналіз: процес співвіднесення слів із статтю, віком та особистістю. Оскільки вони знайшли тисячі суттєво корелюючих слів, діаграми візуалізації були ключовими для розуміння їхніх досліджень (див. Рис. 2 нижче).

Захоплююче, правда?