Интерпретация статистики запросов об СПО

Изображение пользователя aka_melv.

Дорогие друзья, знатоки истории СПО!

Для целей написания научной статьи автору данных строк требуется ваша помощь в интерпретации нескольких графиков из Google trends.
Для начала позвольте представить сами графики.
1. Статистика поисковых запросов и новостной цитируемости "Linux"

2. Статистика поисковых запросов и новостной цитируемости "Open source"

3. Статистика поисковых запросов и новостной цитируемости "Debian"

4. Статистика поисковых запросов и новостной цитируемости "Ubuntu"

Что здесь интересного? Лично меня здесь интересует не статистика запросов, хотя её, наверное, тоже было бы интересно объяснить, а статистика новостной цитируемости. Видно, что по этим направлениям наблюдаются разные тенденции. Не хотелось бы тратить сейчас время на попытки объяснить тренд поисковых запросов, давайте сосредоточимся на нижних частях графиков.
Итак, разрешите обратить ваше внимание на период середины 2007-го/начала 2008-го годов. На всех графиках в этом временном промежутке отмечается локальный максимум, некий всплеск интереса к СПО в новостной среде.
Самый интересный для меня здесь график - статистика цитируемости по Open source. В середине 2007-го виден буквально зашкал.
На остальных графиках всплеск новостной цитируемости приходится на начало 2008-го года.
Причем здесь следует сделать важное замечание, касающееся характера статистики относительно запросов Debian и Ubuntu. Здесь речь идет все-таки об операционных системах, у которых есть интервалы выпуска новых релизов. Естественно, что некоторый всплеск интереса к ним будет приходиться именно на даты новых релизов. Совершенно четко это видно по статистике запросов Ubuntu, это апрель и октябрь каждого года. Когда речь идет о статистике новостной цитируемости, то это в какой-то степени тоже верно, но все равно нижние графики показывают скачок новостной цитируемости в начале 2008-го, а потом этот индекс выравнивается (если бы мы построили график скользящего среднего конечно же).

Теперь, собственно, к делу. Друзья, помогите, пожалуйста, объяснить это всплеск интереса в новостях к теме СПО, который пришелся на период с середины 2007-го по начало 2008-го годов. Надеюсь на вашу помощь и понимание.
Лично у меня есть одна гипотеза, но она требует подтверждения. Гипотеза эта связана с глобальным финансовым кризисом, который дал стимулы к повсеместной минимизации лицензионных издержек и оптимизации бюджетов, что и подтолкнуло мировое сообщество к тому, чтобы задуматься над вариантом более широкого использования СПО. В том числе в госучреждениях, ну и в бизнесе тоже. Наконец, как вариант это может быть связано с маркетинговым провалом Висты, от чего люди также обратили внимание на СПО, но это утверждение вызывает мало доверия.

В общем жду ваших предложений и комментариев, давайте вместе докопаемся до правды:)

Продолжение:
Пришла в голову следующая идея. Все же, имея в виду эти всплески цитируемости, надо говорить о разных событиях, которые стали тому причиной. То есть речь идет, скорее всего, о разных новостях, и пытаться найти какую-то одну первопричину, наверное, не имеет смысла.
Анализ архивных новостей позволяет сделать вывод, что почти все тенденции, которые имели место быть после 2008-го кризисного года, существовали и ранее.
Чтобы понять причину этих всплесков, нужно, видимо, понимать специфику работы системы Google trends. Индекс цитируемости является относительным показателем. То есть, если за неделю не было ни одной новости про линукс, то он будет 0, а если потом появится хоть 10 новостей, то индекс сразу выстрелит вверх. Вот отсюда, как я предполагаю, и происходят такие всплески. То есть нужно смотреть не на них, а на средний уровень этого индекса за какой-то период.
В таком случае видно, что 2007-й год был неким годом затишья, когда про СПО говорили мало, а потом в 2008 году стали говорить чуть больше, но после этого тренд все равно становится в большей степени понижательный. Тогда задачу можно поставить таким образом: почему с начала 2008-го года про СПО стали говорить больше? Ведь здесь речь идет не о каком-то одном значимом событии, а о целой тенденции.

Еще можно получить интересный график, если наложить все 4 предыдущих.

Синий - линукс.
Красный - опен сорс.
Оранжевый - дебиан.
Зеленый - убунту.

Видно, что по запросам поисковика Ubuntu и Linux пользуются наибольшей популярностью. Что касается новостной цитируемости, то здесь лидируют теги Linux и Open source как наиболее широкие понятия. И динамика цитируемости по ним выглядит очень схоже: это затишье в 2007-м, потом скачок в 2008-м с постепенным затуханием.
В любом случае здесь можно говорить о некоей тенденции, которая требует объяснения. Еще раз повторюсь, почему в 2008-м об СПО и линуксе стали говорить и писать больше или стали освещать связанные с этим новости шире?
Глобальный финансовый кризис проявился только к осени 2008-го года, а выявленная тенденция уже год как имела место быть. Выходит, что it-индустрия каким-то образом предвидела этот кризис? Или это с кризисом никак не связано? Тогда это снова отсылает нас к поставленному выше вопросу.
Продолжение следует...:)

+1
Гость - 17 Август, 2012 - 15:13

Именно в начале 2007 случайно попробовал Кнопикс на диске журнала Chip. Ну а потом проба Мандривы и Кубунты. Финансовых затруднений не испытывал))).

+1
SD - 17 Август, 2012 - 15:46

пришелся на период с середины 2007-го по начало 2008-го годов.
у нас в городе в этот период появились в продаже диски с линукс (в магазинах).

0
caskad - 17 Август, 2012 - 20:28

В нашем городе в 2008 году начались массовые проверки организаций на тему лицензионности ПО.
Люди начали искать бесплатную альтернативу..

0
Vlad_W_1999 - 18 Август, 2012 - 13:05

В 2008 вышла версия 8.04, которую уже смело можно называть приемлемым десктопом. Кроме того, интересно было бы посмотреть, а не проводил ли в это время Шаттлворт агрессивной рекламной компании. Потому как у меня имеются смутные воспоминания, что как раз проводил.

Таким образом вырисовывается возможность связать эти дела и посмотреть, что получится. И неплохо бы "причесать" графики с учётом усреднения, а то пики получаются некрасивые. :-)

+2
GVA - 18 Август, 2012 - 18:26
Изображение пользователя GVA.

На самом деле вы ищите не там. Есть подозрение, что спад 2007 года не показатель интереса пользователей, а, к примеру, изменение поискового движка гугла или внезапный рост пользователей интернет или ещё какие причины.

Просто я зашёл на Google Trends и начал вбивать всякую ерунду. И, о боже, спад 2007 года, а потом резкий взлёт 2008 года чётко прослеживается по абсолютно любым запросам! :)

Извините, что испортил вашу теорию заговора, но ведь вначале 2008 года людей, как никогда раньше (а особенно в 2007 году), заинтересовали "тапочки", "ass", "сфера", "fallos", "xyz" и "дмитрий". :)

А если погонять менее распространённые слова, особенно на кириллице, то вы заметите, что до 2008 года на них вообще нет никакой статистики. Короче, все претензии к гуглу.

0
DarkneSS - 18 Август, 2012 - 22:42
Изображение пользователя DarkneSS.

Выборка слов безумно улыбает!

0
GVA - 18 Август, 2012 - 23:09
Изображение пользователя GVA.

Дело в том, что по многим словам, которые я пробовал, вообще нет статистики. :) Выходит, остались самые популярные. Я не виноват. :)

0
Vlad_W_1999 - 18 Август, 2012 - 23:42

Вполне возможно изменение методов сбора статистики. Но, думаю, действует сразу несколько факторов. Вычленить основной было бы интересно.

0
aka_melv - 19 Август, 2012 - 18:41
Изображение пользователя aka_melv.

Да, кстати, это как раз похоже на правду, хотя что-то тут от теории заговора тоже есть:)
Благодарю всех отписавшихся! Если я все-таки что-нибудь смогу написать, то кину ссылку, хотя ничего нового вы в статье не прочитаете в любом случае)))

0
Vlad_W_1999 - 19 Август, 2012 - 20:13

Конечно же скинь ссылку! Интересно ведь.

Есть соблазн обсудить с тобой статистические методы, но у меня есть впечатление, что нас здесь побьют. :-)

0
aka_melv - 20 Август, 2012 - 10:49
Изображение пользователя aka_melv.

Ну на счет статьи, могу привести примерный план, который пока находится в разработке.

Примерный план
1. Актуализация интереса к СПО.
Глобальный финансовый кризис дал стимулы к минимизации издержек и оптимизации бюджетных расходов. Привести примеры, свидетельствующие о возросшем интересе. (вот тут из-за подставы с гуглом будет тяжко)
2. Проблемы свободных лицензий в российской практике
Указать на отсутствие места для свободных лицензий в правовой практике РФ. Упомянуть об общих проблемах СПО в контексте qwerty-эффекта и path-dependence, а также проблемы пиратства.
3. Перспективы применения свободных лицензий в России
Две тенденции в развитии Интернета. Повышение роли СПО в будущем. Неудачи Microsoft. Реформы авторского права в России. Польза от взаимодействия с МЭО.
4. Варианты применения свободных лицензий в образовательных, научных и культурных целях.
Свободные репозитарии и базы данных. Активизация обмена научными работами и произведениями искусства. Проекты Creative Commons.
5. Заключение

Буду рад услышать ценные рекомендации и приму их к сведению.

0
Vlad_W_1999 - 20 Август, 2012 - 12:48

Очень серьёзный объём материала. Даже не знаю, что и сказать. Это несколько месяцев работы. Как минимум. Так что могу только от всей души пожелать удачи в этом благом деле. Ну и с нетерпением ждать публикации, чтобы вдумчиво почитать.

0
aka_melv - 20 Август, 2012 - 14:43
Изображение пользователя aka_melv.

Ну тут дело облегчается тем, что я буквально в июне защитил диплом с примерно таким же содержанием, и мне лишь надо переработать его под формат статьи:)
Сам диплом имеет много недостатков, которые следует доработать, но комиссии он пришелся по душе.
Если интересно, то вот ссылка на ВКР: ВКР по свободным лицензиям
Кстати, если бы кто-нибудь осилил это все прочитать и выступил бы с конструктивной критикой, было бы очень здорово.

0
Vlad_W_1999 - 20 Август, 2012 - 15:34

Значит так... У меня на днях тут день рождения намечается и до него я ни за что браться не хочу. А вот потом, если напомнить, то я с удовольствием почитаю. Может даже что-то получится сказать конструктивного. Ведь профиль не совсем мой. Я сейчас больше по экономике (завязанной на политике) специализируюсь. Да ещё и в разрезе Украины. Хотя, думаю, проблемы должны быть примерно схожие.

0
aka_melv - 20 Август, 2012 - 15:50
Изображение пользователя aka_melv.

Нет проблем, хорошо отметить!:)

Отправить комментарий

CAPTCHA на основе изображений
Введите цифры