Сбор статистических данных и данных об активности пользователей в открытых группах сети "Facebook" с помощью "Netvizz"

Приложение Netvizz* позволяет собрать данные об отрытых группах пользователей и страниц поклонников из социальной сети Facebook.

1. Для работы с данным приложением необходимо зарегистрироваться на Facebook.com

2. Приложение можно найти по ссылке: https://apps.facebook.com/netvizz/

3. Для извлечения информации приложение предлагает следующие возможности:

- извлечение данных об активности пользователей в открытых группах (group data);

- извлечение данных об активности пользователей в страницах поклонников (page data);

- извлечение данных о связи между страницами на основе лайков (page like network);

- извлечение данных о функции поиска на Facebook.com (search);

- статистическая обработка информации о размещенных на Facebook.com ссылках (link stats).

 

 

 4. Извлечение данных об активности пользователей в открытых группах (group data)

Для данной функции выберите опцию "Group Data" и введите на открвшейся старнцие Id группы, количество публикаций или период публикации собираемых данных (group id можно посмотреть здесь: https://lookup-id.com/ ).

Данный модуль позволяет собрать данные по публикациям в группе (по количеству или по периоду публикации), данный модуль создает пять рабочих файлов в указанной Вами папке:

- матрицу с перечисленными показателями по каждой публикации (.tab);

- матрицу со средними статистическими показателями за день в течении указанного Вами периода (.tab);

- матрицу с текстами комментариев пользователей (.tab);

- двусторонний граф-файл, отражающий публикации, пользователей и связи между двумя вершинами (.gdf). Пользователь связывается с публикацией в том случае, если он прокомментировал или оценил публикацию;

- односторонний граф-файл, отражающий связи между пользователями. Связи создаются, если пользователь прокомментировал или оценил публикацию другого пользователя. 

Время скачивания зависит от размера группы. Если указанный объем включает более миллиона комментариев или оценок, то скрипту может не хватать оперативной памяти. В этом случае попробуйте снизить объем скачиваемых данных.

Данный модуль скачивает лишь открытые группы. Если Вы являетесь администратором, сделайте группу открытой, запустите Netvizz, закройте группу.

Модуль скачивает деперсонализированную информацию. Если Вы являетесь администратором группы, то Вы получите персонализированную информацию. 

После извлечения данных скачайте zip-архив. С полученными файлами можно работать в Excel, Gephi или Tableau.

 

5. Извлечение данных об активности пользователей в страницах поклонников (page data)

Данный модуль осуществляется таким же образом, как и модуль извлечения данных из групп на Facebook. 

Перед извлечением данных убедитесь, что Вы отметили страницу (Like). В ряде случаев возможно извлечение 250 или 600 последних публикаций. 

 

6. Извлечение данных о связи между страницами на основе лайков (page like network)

Данный модуль извлекает данные о связи между страницами на основе оценок страницей других страниц. 

 

7. Извлечение данных о функции поиска на Facebook.com (search)

Данный модуль предоставляет удобный интерфейс для сбора данных, связанных с функцией поиска.

Модуль обеспечивает быстрый поиск данных по группам, страницам, местам и событиям, зарегистрированным в сети Facebook.com.

Во-первых, предложенный модуль ограничивает данные 1000 результатами. Для исследовательских задач ограничение объема в 1000 результатов представляется достаточным.

Для скачивания данных выберите тип данных (type) - страница (page), группа (group), событие (event), место (place, работает с перебоями)

Например, сбор данных по событиям с поисковым запросом "Porsche" выдает 273 результата, а по поисковому запросу "Mercedes" - 352 результата, "Jaguar" - 321 результат, "Volkswagen" - 187 результатов, "Volvo" - 146 результатов (по состоянию на 20.10.2015).  

Так при сравнении поисковых запросов по определенным видам спорта модуль выводит следующие данные (по состоянию на 20.10.2015):

Поисковый запрос Количество страниц Количество групп Количество событий
Taekwondo 499 151 327
Karate 504 143 353
Jujutsu 524 131 96
Basketball 530 142 355
Hockey 518 130 347

 

В нашем следующем примере поисковый запрос "Business intelligence" выдал 528 результатов в поиске по страницам (20.10.2015)

Ниже предлагается возможность скачать файл с расширением .tab в zip-архиве. С данным файлом можно работать в Exclel или в Tableau. Ниже выводится компактная таблица .html для копирования.

 

 

При помощи данного модуля выводятся следующие данные:

- id страницы - имя группы - категория - количество оценивших - количество регистраций в странице - количество упоминаний группы - краткое описание - является ли сообществом - проверено ли - картинка - ссылка - сайт - 

В случае анализа групп модуль извлекает id группы, картинку, описание, открытость, время последнего обновления. 

В случае анализа событий модуль извлекает id события, название, картинку, описание, время начала и открытость события.

Используйте Gephi, Excel, Tableau, SPSS и другие программы статистической обработки данных для дальнейшего анализа.

 

8. Статистическая обработка информации о размещенных на Facebook.com ссылках (link stats)

Данный модуль собирает данные о ссылках, размещенных в сети Facebook.com. Функция проста в обращении: необходимо вставить ссылку в окно вместе с http:// или https://.

В качестве примера сравним статистические данные ссылок на органы внешних сношений Российской Федерации, Соединенного Королевства, Соединенных Штатов Америки, Федеративной Республики Германия, Французской Республики в сети Facebook.com (по состоянию на 20.10.2015)

  URL Количество поделившихся Количество оценивших Количество комментариев Всего
Foreign Office http://www.gov.uk/fco 1071 718 553 2342
Auswärtiges Amt http://www.diplo.de/ 748 675 335 1758
Министерство иностранных дел http://www.mid.ru/ 183 472 54 709
Department of State http://www.state.gov/ 11542 12828 4736 29106
France Diplomatie http://www.diplomatie.gouv.fr/ 1425 713 441 2579

 

(c) РЦ "Центр социологических и Интернет исследований", СПбГУ.

* B. Rieder (2013). Studying Facebook via data extraction: the Netvizz application. In WebSci '13 Proceedings of the 5th Annual ACM Web Science Conference (pp. 346-355). New York: ACM

 

 

P.S. Мы будем рады Вашим замечаниям и предложениям, касающимся данного раздела: Этот адрес электронной почты защищён от спам-ботов. У вас должен быть включен JavaScript для просмотра.