Проекты с открытым исходным кодом: изучение теоретической и эмпирической эволюции сочинение пример

ООО "Сочинения-Про"

Ежедневно 8:00–20:00

Санкт-Петербург

Ленинский проспект, 140Ж

magbo system

Сочинение на тему Проекты с открытым исходным кодом: изучение теоретической и эмпирической эволюции

Динамическая эволюция проектов с открытым исходным кодом

<Р> Резюме

Этот проект направлен на изучение динамического развития проектов с открытым исходным кодом как эмпирически, так и теоретически. В частности, мы намерены ответить на три вопроса:

     

  • Какую роль играют коммерческие фирмы в популярных проектах с открытым исходным кодом?
  •  

  • Как коммерческие фирмы работают и конкурируют с открытым исходным кодом?
  •  

  • Что побуждает неоплачиваемых программистов продолжать работать над проектами с открытым исходным кодом?

Успех движения с открытым исходным кодом привлекает внимание ученых довольно долгое время. Однако из-за доступности данных в современной литературе было проведено лишь несколько эмпирических тестов, и теоретическое развитие также сдерживается отсутствием эмпирических данных.

Предлагаемый проект основан на хорошо документированном интерфейсе прикладного программирования (API) GitHub, крупнейшего в мире поставщика услуг хостинга исходного кода. он попытается ответить на вышеуказанные вопросы и создать базу данных выборки для дальнейшего изучения.

Результат пилотного исследования будет использоваться двумя способами:

Во-первых, три регулярные исследовательские работы будут написаны и представлены в международно-признанные журналы в области промышленной организации.

     

  • Rand Journal of Economics (4 * ABS),
  •  

  • Международный журнал промышленной организации (3 * ABS),
  •  

  • Журнал по экономике и стратегиям управления (3 * ABS).
  •  

  • Во-вторых, это послужит основой для дальнейшей заявки на грант. Потенциальные источники внешнего финансирования включают:
  •  

  • Стандартная заявка на получение гранта ESRC,
  •  

  • Товарищество Марии-Кюри,
  •  

  • Стартовый грант ERC.

Фон

В разработке программного обеспечения с открытым исходным кодом участвуют разработчики из разных мест и организаций, которые делятся кодом для разработки программ. Это стало довольно популярным среди сообщества программистов и часто упоминается как движение с идеологией и восторженными сторонниками. В основе этого процесса лежат три интересных явления:

• Неоплачиваемые добровольцы занимаются нетривиальной частью разработки программ с открытым исходным кодом,

• В отличие от коммерческого программного обеспечения, программное обеспечение с открытым исходным кодом не продается и не лицензируется за плату.

• Многие коммерческие фирмы активно участвуют в разработке проектов с открытым исходным кодом.

Движение с открытым исходным кодом до сих пор было успешным. Воздействие проектов с открытым исходным кодом распространялось на другие области, такие как научные круги. В научном мире языки программирования с открытым исходным кодом, такие как Python, R и Octave, также становятся все более популярными в области машинного обучения и статистики.

В целом, чтобы открыть черный ящик процесса разработки проектов с открытым исходным кодом и понять его деловой цикл, модель конкуренции и продолжительность жизни, не только представляет академический интерес, но также имеет важные последствия для стратегий фирм. Это также вопрос исследования, который этот проект хочет решить.

Ограничение старой базы данных (SourceForge)

Большая часть эмпирической литературы (Athey et al., 2014; Fershtman et al., 2011; Lemley et al., 2011; Lerner et al., 2006), посвященная открытым источникам, основана на их работе на основе данных, полученных из SourceForge. До появления GitHub SourceForge был ведущим поставщиком услуг размещения исходного кода. Как показано в таблице 1, по сравнению с тем, что мы можем получить из GitHub, данные SourceForge довольно неполны и не содержат многих важных аспектов информации о проекте.

     

  • Характеристики SourceForge GitHub
  •  

  • Дата создания проекта Да Да
  •  

  • Версии проекта Да Да
  •  

  • Имена участников Да Да
  •  

  • Когда была сделана определенная фиксация кода Нет Да
  •  

  • Информация о вкладе каждого участника Нет Да
  •  

  • Динамика участников Нет Да
  •  

  • Количество разветвленных проектов (показатель популярности проектов среди разработчиков) Нет Да
  •  

  • Количество загруженных проектов (показатель популярности проектов среди клиентов) Да Да
  •  

  • Ориентированные на пользователя данные Нет Да
  •  

  • Данные для проекта Да Да

Lerner, Pathak and Tirole (2006) используют данные SourdeForge для изучения динамики участников с открытым исходным кодом. Они используют суффикс электронной почты участников в качестве идентификации организации разработчиков, т. Е. Если разработчик использует адрес электронной почты с «.com» (кроме hotmail.com и gmail.com), он или она будет классифицирован как фирма- спонсор в противном случае, если адрес электронной почты оканчивается на «.edu» или «.org», он или она будут определены как неоплачиваемый участник / программист. После отбора 100 проектов из SourceForge, они пришли к выводу, что проекты с открытым исходным кодом с участием спонсоров более крупных фирм, вероятно, будут крупнее и успешнее.

Хотя их выводы соответствуют теоретическому прогнозу, метод идентификации является относительно неточным, что может существенно подорвать достоверность их результатов. Кроме того, их анализ на самом деле статичен, и поэтому они не могут реально исследовать динамику продолжительности жизни проектов с открытым исходным кодом, что важно для понимания бизнес-структуры с открытым исходным кодом. Тем не менее, это то, что они могут иметь с данными SourceForge.

GitHub, как хостинг-провайдер, обладает важной особенностью – «каждое событие записывается и экспортируется». Здесь событие относится к любому виду деятельности, которую любой разработчик выполняет с любым проектом, например, добавление / изменение / удаление строк кода, разветвление репозитория и т. Д. С помощью API GitHub мы можем легко профилировать полный портрет любого размещенного проекта. , которые позволяют нам проводить дальнейший анализ и надлежащим образом решать наши вопросы исследования.

Теоретическая задача

С теоретической точки зрения восторженное поведение отдельных программистов и коммерческих компаний, вовлеченных в процессы с открытым исходным кодом, с первого взгляда поражает экономиста. В качестве первоначального ответа Лернер и Тироль (2002, 2004) определили несколько кратких и долгосрочные выгоды, которые могут иметь значение.

Во-первых, разработка проектов с открытым исходным кодом может помочь разработчикам сформировать свои навыки программирования. Этот результат особенно актуален для системных администраторов, которые ищут конкретные решения для своей компании. Во-вторых, программист может найти истинное удовольствие, если он разрабатывает «классные вещи». В-третьих, в конечном счете, вклады с открытым исходным кодом могут помочь разработчикам создать репутацию, которая приведет к будущим предложениям работы, долям в коммерческих компаниях с открытым исходным кодом или будущему доступу к рынку венчурного капитала. Однако они не предоставили формальную теоретическую модель разработки с открытым исходным кодом.

В недавней работе Athey (2014) была построена динамическая модель, объясняющая эволюцию программных проектов с открытым исходным кодом, но ее модель в значительной степени основывается на предположении о взаимном альтруизме программистов. Это предположение сомнительно в том смысле, что оно закрывает дверь для изучения оппортунистического поведения участников с открытым исходным кодом. Он по своей сути не совместим со стандартной структурой экономических исследований.

Чтобы восполнить этот пробел в исследованиях, одной из целей этого исследовательского проекта является рационализация и прогнозирование поведения разработчиков в различных ситуациях. В частности, мы заинтересованы в моделировании процесса принятия решений о вкладчиках проекта и профилировании ситуации, когда участники проекта могут прекратить разработку конкретного проекта и перейти к другим.

Еще одна проблема заключается в понимании конкуренции между открытым исходным кодом и коммерческим программным обеспечением. Чтобы решить этот вопрос, мы создадим стилизованную модель для изучения базового механизма, оценки воздействия на социальное обеспечение и определения деловых последствий для фирм, которые готовы спонсировать проекты с открытым исходным кодом. Кроме того, этот результат исследования может также служить руководством для коммерческих фирм о том, как выбрать лучшие проекты с открытым исходным кодом для поддержки.

Запланированная работа

Этот проект планируется в четыре этапа:

Этап 1: сбор данных: (3-4 месяца)

На начальном этапе мы рассмотрим репозитории GitHub и примеры проектов с открытым исходным кодом. Сетевой паук, интегрированный с GitHub API, будет запрограммирован и установлен на мини-сервере 24/7 для выполнения задачи сбора данных.

По окончании процесса автоматического сбора будет нанят научный сотрудник для очистки данных.

Стадия 2: классификация участников: (2 месяца)

После получения чистых данных мы возьмем подмножество данных в качестве обучающего набора для алгоритма машинного обучения. Учебный комплект будет содержать участников, чей рабочий статус (оплачен / не оплачен за вклад) определенно известен из других информационных каналов. например платные участники Pyston, проекта, спонсируемого Dropbox, перечислены непосредственно на сайте Dropbox.

Алгоритм машинного обучения будет запрограммирован и установлен в ноутбук с высокими техническими характеристиками. Этот алгоритм будет изучать события платных / неоплаченных участников и использовать эту информацию для классификации остальных участников в базе данных.

Этап 3: Эмпирический и теоретический анализ: (5 месяцев)

Данные, которые мы получили от GitHub, будут использованы для формирования двухрежимной сети проектов и участников. Мы можем использовать эту сеть для построения двух разных сетей, то есть сети участников и сети проекта.

Затем мы можем провести групповой анализ в сети проекта, чтобы проверить наши гипотезы о динамике развития проекта с открытым исходным кодом, и использовать метод Fershtman et al. (2011), чтобы изучить эффекты распространения среди проектов и участников GitHub.

Развитие теории будет параллельно с эмпирическими исследованиями. Мы собираемся построить модель для объяснения мотивации участников и модели конкуренции соответственно. Наша модель в двух статьях соответственно.

Результаты исследований

Эмпирическая статья о динамике паттерна разработки с открытым исходным кодом

Чтобы в полной мере воспользоваться этими данными, необходимо пересмотреть бизнес-модель с открытым исходным кодом, описанную в (Lerner et al. 2006). Анализ будет использовать алгоритм машинного обучения и подмножество репозиториев GitHub в качестве учебного набора, чтобы определить, платит ли конкретный участник коммерческая фирма или вносит вклад инстинктивно. Этот метод даст нам гораздо более точную информацию, чем идентификация автора по его адресам электронной почты. Центральный вопрос, который рассматривается в этом документе: кто играет более важную роль в растущем проекте с открытым исходным кодом, спонсором фирмы или программистом?

С точки зрения проекта, этот документ предоставляет отправную точку для понимания мотивации участников проектов с открытым исходным кодом и бизнес-модели фирм, полагающихся на проекты с открытым исходным кодом.

Целевым журналом этой статьи является The Rand Journal of Economics.

Теоретическая статья о мотивации разработчиков к разработке с открытым исходным кодом

После получения эмпирических данных из первой статьи мы рассмотрим изменение доли корпоративных взносов в крупных и растущих проектах. Для этого мы создадим теоретическую модель, объясняющую мотивацию участников проекта с открытым исходным кодом. На основе повторяющейся теории игр, поведение разработчиков будет полностью рационализировано, и будет оцениваться влияние на социальное обеспечение, а также прогнозы продолжительности жизни проектов.

Целевым журналом этой статьи является Международный журнал промышленной организации.

Третий документ о конкурсе открытого и закрытого программного обеспечения

Коммерческие компании могут взаимодействовать с проектом с открытым исходным кодом несколькими способами. Хотя улучшения в программном обеспечении с открытым исходным кодом неприемлемы, коммерческие компании могут извлечь выгоду, если они также предложат опыт в каком-то проприетарном сегменте рынка, который дополняет программу с открытым исходным кодом.

Распространенной ситуацией в индустрии программного обеспечения является сосуществование продуктов с открытым исходным кодом и проприетарных продуктов, таких как Android v.s. IOS. Google приобрел Android за 50 миллионов долларов, а затем разместил свой код в открытом доступе. Люди могут спросить, что является движущей силой Google? В этом документе будет рассмотрено обоснование решения Google – каковы стимулы для коммерческих фирм делиться своим кодом по лицензии с открытым исходным кодом? У нас уже есть прототип модели для объяснения этого феномена, и он будет пользоваться эмпирической поддержкой этого исследовательского проекта.

Целевым журналом этой статьи является Журнал по экономике и стратегиям управления.

Другие направления:

Распространение знаний и выбор лицензий также играют решающую роль в разработке программного обеспечения. Существует два вида вторичного распространения знаний: вторичное распространение на основе проекта и вторичное распространение на основе разработчика. Изучая данные GitHub и создавая сеть с двумя режимами, возможно, у нас будут другие документы о распространении технологий и оптимальных лицензиях.

Потенциальное воздействие

В настоящее время открытые исходные коды являются неотъемлемой частью информационных технологий, и многие известные ИТ-компании, такие как Google, Facebook и Amazon, вкладывают значительные средства в поддержку проектов с открытым исходным кодом. Таким образом, этот документ не только нацелен на академическую аудиторию, но и пытается привлечь внимание практиков, особенно для тех фирм, которые активно спонсируют проекты с открытым исходным кодом. Кроме того, он помогает отдельным разработчикам и фирмам выбирать «правильные» проекты с открытым исходным кодом для работы.

Заявка на получение гранта на будущее

Набор данных GitHub предоставляет отличную возможность для изучения динамики проектов с открытым исходным кодом, и он имеет большой потенциал для долгосрочного воздействия исследований и возможностей внешнего финансирования. Первое грантовое предприятие, скорее всего, будет использоваться в качестве начального фонда, то есть первого этапа подачи заявки на более крупный фонд. Количество проектов, размещенных на GitHub, составляет более 10 миллионов, и ежедневно добавляется более 4500 новых репозиториев. Это спящее в Интернете сокровище, идеально подходящее …

Зарегистрируйся, чтобы продолжить изучение работы

    Поделиться сочинением
    Ещё сочинения
    Нет времени делать работу? Закажите!

    Отправляя форму, вы соглашаетесь с политикой конфиденциальности и обработкой ваших персональных данных.