Сбор и анализ данных в сети "Instagram"

Дата публикации:

1. Для начала работы зарегистрируйтесь в сети "Instagram". Найдите соответствующее приложение в Itunes (IOS) или Google Play (Android).

2. Используйте Instagram Hashtag Explorer*. Для этого перейдите по ссылке: https://tools.digitalmethods.net/netvizz/instagram/index.php (дата обращения 29.10.2015).

3. Вы видите интерфейс для браузера. Данная программа позволяет осуществить сбор фото-контента и данных о пользователях по хэштегу или заданному местоположению на земном шаре в сети "Instagram".

После сбора данных программа создает три файла, которые можно скачать в архиве:

a) файл ".tab", представляющий собой список медиа-публикаций с данными о публикациях;

b) файл ".tab", представляющий собой список пользователей, опубликовавших медиа в сети, с данными пользователей;

c) файл ".gdf", представляющий собой матрицу связанных между собой хештегов.

Авторизируйтесь в сети и запустите программу.

4. Далее Вам предложено выбрать способ сбора данных.

Способ первый: задать поисковый хештег.

Способ второй: задать широту, долготу места, временной интервал.

Вам также предложено собрать дополнительно информацию о пользователях, опубликовавших медиа, а также разрешение изображения публикации.

5. Рассмотрим метод сбора данных по хештегу "ICRC" (International Committe of the Red Cross).

Введите в поле "Tag" необходимый запрос - хештег.

Введите в поле "Iterations" количество запросов к серверу Instagram. Разработчики указывают максимальное количество запросов в 1000. Количество запросов зависит от работы Instagram Api, числа подписчиков и количества фото у аккаунта, через который Вы собираете данные. Увеличение количества запросов увеличивает объем собираемых данных. 

Поставьте галочку в поле "Get Users' Info" - "Собрать данные пользователей".

Выберите "Thumbnail" в поле "Preview Media" - "Иконки" - "Предпросмотр медиа". 

Нажмите "Отправить".

6. В нашем примере, программа:

- сделала 20 запросов к серверу;

- извлекла данные о 170 пользователях;

- создала три файла с данными;

- создала архив ".zip" с файлами для скачивания;

- создала таблицу ".html" для обзора скачанного медиа.

NB! Программа извлекает публикации, которые однажды были помечены указанным хештегом. Указанное время публикации означает тот момент, когда публикация была помечена хештегом.

NB! Пролистайте таблицу вправо, чтобы польностью увидеть тип извлекаемых данных.

Заголовки столбцов следующие:

ID медиа - Дата и время создания - Местоположение - Количество комментариев - Количество оценок (лайков) - Фильтер (оформление фото) - Ссылка на фото - Подпись под фото - Иконка медиа - Используемые хештеги - Имя пользователя - ID пользователя - Количество медиа пользователя с соответствующим поисковым запросом - Краткая биография пользователя - Сайт пользователя - Общее количество публикаций пользователя - Общее количество подписчиков пользователя - Общее количество подписок пользователя

 

7. Рассмотрим пример со сбором данных по заданному местоположению на земном шаре.

Для этого нам понадобится указать в программе широту и долготу, а также временной период публикации медиа.

Для определения широты и долготы  воспользуйтесь Google Maps. URL: https://www.google.ru/maps/ (дата обращения 29.10.2015).

В нашем примере зададим местоположение штабквартиры Международного комитета красного креста (МККК).

Для этого после перехода на Google Maps мы задали адрес МККК - Avenue de la Paix 19,1202 Genève - после чего кликнули левой кнопкой мыши рядом (как можно ближе) с отметкой на карте.

Широту и долготу места можно увидеть в нижней части экрана. Скопируйте эти показатели.

 

8. Выберите метод локации. Скопируйте широту и долготу. Установите дистанцию вокруг точки в метрах. Укажите временной интервал. Поставьте галочку для сбора данных о пользователях и выберите "Иконки". Нажмите "Отправить".

NB! Увеличение дистанции и временного интервала влечет к увеличению объема извлекаемых данных. При увеличении данных компьютеру может не хватить оперативной памяти либо ограничение Instagram API по запросам может вступить в силу. Начните с малого. В нашем примере данные будут извлечены на расстоянии 50 метров в течение пяти дней с 23 октября 2015 года по 28 октября 2015 года.

 

9. Дождитесь скачивания данных. 

В нашем примере программа:

- собрала данные о 468 пользователях;

- собрала данные о 737 публикациях медиа;

- создала архив для скачивания;

- создала "html" таблицу с данными.

NB! Не забудьте пролистать таблицу вправо. В таблице содержатся следующие столбцы:

ID публикации - Время создания - Местоположение - Количество комментариев - Количество оценок (лайков) - Фильтр (оформление) - Ссылка в сети Интернет - Подпись под публикацией - Иконка - Хештеги - Имя пользователя - ID пользователя - Количество медиа публикаций по соответствующему запросу - Биография пользователя - Сайт пользователя - Общее количество публикаций пользователя - Количество подписчиков пользователя - Количество подписок пользователя

 

 

10. Для анализа файла ".gdf" и построения графа хештегов используйте Gephi (соответствующее руководство раздела "В помощь пользователям" .

 

11. Для анализа файлов ".tab" и построения графа пользователей используйте Gephi (соответствующее руководство раздела "В помощь пользователям" .

 

12. Для визуализации и статистической обработки используйте пакет "Tableau" и пакет "SPSS" соответственно. Данные файлов ".tab" также можно импортировать в Excel.

(с) РЦ "Центр социологических и Интернет исследований", СПбГУ

 

* См. Rieder, Bernhard. Instagram Hashtag Explorer. Computer software. Vers. 1.1. N.p., 15 October 2015. Web.

 

 

P.S. Мы будем рады Вашим замечаниям и предложениям, касающимся данного раздела: Этот адрес электронной почты защищён от спам-ботов. У вас должен быть включен JavaScript для просмотра.

 
 
 
 

Печать