Ниже представлен небольшой дайджест работы группы в предыдущем месяце, а также планы на нонешний.
Результаты:
-Мобильность разработчиков.
Во-первых,
мы разработали интересный метод слежения за географическими
перемещениями разработчиков - анализ активности в IRC каналах.
Во-вторых,
Антон сделал пробный анализ логов из открытого архива Ubuntu за
2004-2007 год. Мы получили представление о погрешностях сопоставления
данных из IRC с географическими локациями. Предстоит увеличить точность
поиска и отчистить данные от недостоверно определенных пользователей.
Были получены интересные результаты о вкладе разных стран в общении по
каналам IRC, а также среднее количество пользователей и разработчиков
участвующих в переписке на душу населения.
В-третьих,
сделан небольшой анализ данных из Stackalytics о переходах
разработчиков OpenStack между компаниями. Его результаты были доложены
мною на конференции OpenStack Day в целях привлечения внимания широкой
общественности к работе группы. Обратной связи получено мало, однако в
новостях нас упомянули:
http://www.pcweek.ru/foss/article/detail.php?ID=176131
В-четвертых,
Илья придумал интерактивный сервис-карту для отображения
результатов анализа IRC логов. Детали, увы, он раскрывать не спешит.
-Пользователи Open Source.
К
нам присоединился Марат. Он изучает такую важную часть Open
Source как его пользователей. Его исследование началось с изучения
популярных веб-браузеров. Статистика указывает на любопытную задержку в 1
год между ростом количества поисковых запросов и статистикой
использования того или иного браузера.
Текущие проблемы:
Застыла тема по анализу пакетов. Хотелось бы довести начатое до промежуточной точки, получив rank’и на графе пакетов.
Увы,
несмотря на обилие промежуточных результатов, материалы с обещанной
периодичностью в блоге не публикуются. Стоит подумать о том чтобы либо
уменьшить планку по качеству или частоте обновления блога.
Планы на август:
Продолжаем
работы по IRC логам, увеличивая достоверность и качественность данных.
Кроме того нам важно найти правильную презентацию данных, которая
позволила бы пролить свет на качественные социологические вопросы
мобильности разработчиков.
С
технической точки зрения, нам предстоит усовершенствовать код
определения географии разработчиков. Возможно, сделать первый
прототип динамического сбора данных IRC каналов, чтобы получить текущую
картину. Также, полезен был бы задокументированный вижн, о том, как
будет выглядеть и работать предполагаемый веб-сервис аналитики.
Хочется
опубликовать промежуточные результаты по рабочей мобильности и
географии разработчиков, а также промежуточные итоги статистики
использования веб-браузеров.