В 2009 году в COBOL было 250 миллиардов строк кода и 1 миллион программистов?

В 2009 году COBOL исполнилось 50 лет. Это получило некоторую огласку с заявлениями, в которые мне довольно трудно поверить:

Статья в Guardian «Cobol достигает 50 и продолжает считать» .

По словам Дэвида Стефенсона, британского менеджера поставщика программного обеспечения Micro Focus, «от 70% до 80% бизнес-операций UK plc по-прежнему основаны на Cobol».

[...]

Большая часть этого обслуживания и развития происходит на продуктах IBM. Чарльз Чу, директор группы программного обеспечения компании по разработке продуктов и стратегии, говорит, что он не считает слово «наследие» уничижительным. «Бизнес постоянно развивается, — добавляет он, — но во всем мире существует 250 миллиардов строк кода на Cobol , который хорошо работает. Зачем компаниям заменять хорошо работающие системы?»

Часто цитируемое сообщение форума/блога «50 лет спустя, Кобол по-прежнему так же влиятелен» .

Статистика Cobol свидетельствует о его огромном влиянии на деловой мир: существует более 220 миллиардов строк Cobol, что соответствует примерно 80 процентам активно используемого в мире кода. В мире более миллиона программистов на Коболе. Ежедневно в Cobol совершается в 200 раз больше транзакций, чем в Google.

Джефф Этвуд предпринял попытку в своем блоге «COBOL: Everywhere and Nowhere» . Проблема в том, что это всего лишь косвенные доказательства.

Недавно тема всплыла на Programmers.SE , но пока это тоже только неофициальные данные.

Есть ли достоверные данные о:

  • общее количество строк всего используемого кода?
  • общее количество строк используемого кода COBOL?
  • общее количество всех программистов?
  • общее количество программистов COBOL?
Вот две ссылки, которые могут оказаться полезными: EE Times , Dr.Dobbs
Помните, что 1 миллион строк COBOL можно переписать примерно в 10 строк C.

Ответы (1)

Никто не знает.

Ни один из источников общего LOC не предоставляет никаких средств или методов.

Приношу свои извинения за точные цифры после 2008 года.

Общее количество строк всего используемого кода?

  • Один триллион (2001). [19]
    • C/C++: 180 миллиардов, Ассемблер: 140-220 миллиардов, Другое: 280 миллиардов.

Общее количество строк используемого кода COBOL?

  • 200 миллиардов (2008 г.). [10]
  • 180 миллиардов (2006 г.). [12]
  • 200 миллиардов (2005 г.). [14]
  • 225 миллиардов (2001 г.). [19]
  • 100 миллиардов (2000). [21]

Общее количество всех программистов?

  • 14,6 миллиона (2009 г.). [8]

Общее количество программистов на COBOL?

  • 1,5–2 миллиона (2008 г.). [19]
  • ~ 2 миллиона (2000 г.). [20]

Если принять во внимание тот факт, что только в США насчитывается не менее 2000 банков и что приведенные ниже источники дают цифры от 100 тысяч до 343 миллионов кредитов для финансовых систем; Ну быстро складывается.

Если добавить гражданские и военные системы... это как минимум миллиард.


Источники

2012

1. Практический пример В этой работе мы анализируем портфель программного обеспечения Cobol крупной организации, работающей в финансовом секторе . Исходные коды Cobol представляют собой смесь кода, написанного вручную и сгенерированного с помощью инструментов автоматизированной разработки программного обеспечения (CASE), таких как TELON, COOL:Gen, CANAM и других.

Портфелю уже несколько десятилетий, и он большой по многим параметрам; например, с точки зрения строк кода, количества систем или количества модулей. Чтобы дать представление, портфолио содержит более 18,2 миллиона физических строк кода (LOC) , распределенных по 47 информационным системам.


2. Дэвид Браун обеспокоен. В качестве управляющего директора группы трансформации ИТ в Bank of New York Mellon он отвечает за работоспособность и благополучие 112 500 программ Cobol, 343 миллионов строк кода, которые выполняют основные банковские и другие операции . Но многие люди, создавшие эту кодовую базу, некоторые из которых восходят к ранним дням Кобола в 1960-х годах, уйдут на пенсию в течение следующих нескольких лет.

С такой ситуацией столкнулся Джим Гвинн, директор по информационным технологиям Агентства фермерских услуг Министерства сельского хозяйства США. « У нас есть миллионы строк кода на Коболе , и мы давно его переписываем», — говорит он. «Вносить изменения в код становится все труднее из-за сложности и истощения базы знаний, которая его написала».


2011

3. Мы создали прототип и применили предложенную стратегию к набору программ из среды выполнения наших клиентов. Эти программы были разной длины от нескольких тысяч строк кода до примерно 80 тыс . строк кода .


4. Программная система, рассматриваемая в данном тематическом исследовании, представляет собой фрагмент конфиденциальной системы COBOL объемом 100 000 LOC из банковской отрасли . Он состоит примерно из 1100 разделов по 150 программам и тетрадям (включая файлы).


2010

5. VisualAge PACBASE — генератор приложений. Во всем мире существуют миллиарды строк COBOL, созданных в этой среде. По историческим причинам для таких приложений требуются определенные контексты выполнения, а именно старые терминалы (экраны без графических окон), мейнфреймы и CICS (система управления информацией о клиентах).

Сфера деятельности SCAFRUITS широка: управление заказами, отгрузка,
квалификация поставщиков и продуктов и рекомендации, своевременное управление ценами, активация/блокировка продукта

Что касается его технических аспектов, размер приложения оценивается в 3 млн. LoC , 600 программ, 400 экранов, 200 пакетных программ, 300 потенциальных пользователей, 48 000 ссылок на продукты и только 2 000 активных ссылок одновременно. 350 000 транзакций в день и 100 000 создаваемых строк заказов в день .


6. Система, рассматриваемая в этой статье, представляет собой крупное (> 1 MLOC) промышленное приложение , которое поддерживает основные виды деятельности (например, страхование и ипотечные кредиты) крупного бельгийского банка . Несмотря на то, что работа над системой началась совсем недавно, в 2005 году, банк решил разработать серверную часть этой новой системы на языке COBOL , чтобы упростить интеграцию с существующей инфраструктурой.


7. Проект: Национальный фонд искусств (NEA). [M]модернизация бизнес-систем NEA (Финансовый менеджмент - Управление грантами - Автоматизированный панельный банк)

Полностью модернизированы 656 000 LOC плоских файлов Wang-COBOL и RMS для среды C++ и SQL Server и 3270 экранов для среды MS Windows.

Проект: Нортроп Грумман. Демонстрация [T] преобразования и последующая модернизация Инкрементов 1 и 3 системы REMIS ВВС.

Полностью модернизировано более 400 000 LOC Tandem COBOL для кода C++ и Java.


2009 г.

8. По первоначальной оценке Evans Data, на 2009 год во всем мире будет примерно 15,2 миллиона разработчиков. Тем не менее, это уменьшило оценку примерно на 600 000 в текущем отчете.

В предыдущем отчете Evans Data прогнозировала, что в Северной Америке численность разработчиков вырастет до 3,85 млн человек в Северной Америке в 2009 году. В текущем отчете эта цифра изменена до 3,72 млн исходя из текущих экономических условий. Эванс не раскрыл данные по другим регионам.


9. Администрация социального обеспечения заключает основные приложения Cobol в оболочки Extensible Markup Language и публикует их в качестве сервисно-ориентированных архитектурных сервисов. Он сохранит около 20 процентов из 36 миллионов строк кода Cobol, который он использует, сказал Хилл.


2008 г.

10. Недавние статистические данные, предоставленные Datamonitor IBM, показывают огромные масштабы накопленной интеллектуальной собственности:

• Около 200 миллиардов строк кода COBOL находятся в работе.
• 75 % бизнес-данных в мире и 90 % финансовых транзакций обрабатываются на языке COBOL.
• Во всем мире 1,5–2 миллиона разработчиков работают с кодом COBOL.
• Ежегодно в работающие системы добавляется около 5 миллиардов строк нового кода COBOL.


2007 г.

11. Устаревшие системы COBOL обычно содержат миллионы строк кода (LOC) , разбросанных по тысячам модулей, разрабатываемых десятками людей на протяжении многих лет, часто плохо документированы, и в значительной степени знания о них утеряны.

Мы использовали SQuAVisiT для изучения крупной системы наследия COBOL крупного страхового фонда: 3 тысячи модулей, 1,7 миллиона LOC .


2006 г.

12. По оценкам Gartner, во всем мире используется 180 миллиардов строк кода Cobol.


2005 г.

13. Заказчик авторов — немецкая компания среднего размера, оказывающая финансовые услуги . Эти услуги основаны на двух крупных прикладных системах, которые используют одну и ту же платформу HP UNIX, но относятся к совершенно разным мирам программных технологий.

• Общая система COBOL состоит из 1398 пакетных программ, 485 интерактивных программ и 7621 модуля копирования.
• Общее количество строк (LOC) составляет почти 2 миллиона, после вычета комментариев (~ 25%) фактический код достигает примерно 1,5 миллиона строк .
• Система обслуживается штатом из 8 человек.

Расчет только с 8% чистого LOC означает, что 120 000 строк кода в год добавляются, изменяются или удаляются восемью программистами . Предполагая 80 миллионов усилий в год, производительность обслуживания составляет 1500 строк кода на человека в месяц.


14. Например, Cobol остается наиболее широко используемым языком программирования в большом бизнесе, на него приходится 75% всех компьютерных транзакций , и он не собирается исчезать. Кобол широко распространен в финансовом секторе ( составляет 90% всех финансовых транзакций ), в обороне, а также в устоявшихся производственных и страховых секторах. По нашим оценкам, сегодня в производстве находится более 200 миллиардов линий Cobol , и это число продолжает расти от трех до пяти процентов в год .


15. Несмотря на то, что документ составлен на основе очень удобного примера проекта (всего 90 000 LOC), мы применили ту же методологию в других проектах. Например, методология анализа воздействия, а также оценки усилий и затрат также использовалась для предоставления заказчику точной информации о проекте, в рамках которого необходимо было изучить портфель программного обеспечения на 50 миллионов LOC для архитектурной модификации существующих номеров банковских счетов до десяти. цифры.


2004 г.

16. Приблизительно от 60% до 80% всех бизнес-приложений по-прежнему написаны на языке COBOL , поэтому неудивительно, что в кодовой базе компаний, участвующих в ARRIBA, было обнаружено именно это. Поэтому COBOL быстро привлек наше внимание.

Код плохо структурирован и плохо документирован. Объем кода огромен (миллионы LOC) и много раз адаптировался по нескольким причинам (переключение платформ, преобразование 2000 года, переход на валюту евро и т. д.). Таким образом, синхронизация документации с этими эволюционными изменениями происходила не всегда.


17. За последние три десятилетия значительное количество программного обеспечения было разработано с использованием процедурных языков. Например, Койл оценивает размер систем, написанных на Коболе, более чем в 100 миллиардов строк.


18. Были проведены два тематических исследования с нашими преобразованиями на реальных промышленных системах Cobol. Исходным кодом в первом примере был IBM Cobol, и он был получен от той же банковской компании , что и исходный код. Была одна большая система из 2,6 миллионов LOC в почти 1000 программах . Размер программы варьировался от 40 до 13000 LOC. Количество операторов на программу колебалось от двух до 4000 операторов. Всего в системе было около 400 000 заявлений.

Во втором примере были преобразованы несколько систем, написанных на Micro Focus Cobol . Как и в первом тематическом исследовании, общий размер составил 2,6 миллиона LOC, но это было совпадение. Исходный код состоял почти из 3000 программ, а размеры отдельных программ варьировались от 25 до 8000 LOC. Количество утверждений на программу колебалось от 10 до почти 3400. Всего было свыше 1,2 миллиона утверждений . Это значительно большее количество операторов по сравнению с первым случаем было связано с тем, что в первом примере использовался большой объем кода для объявлений данных.


2001 г.

19. Во-первых, существует около 300 диалектов Кобола, и у каждого компилятора есть несколько версий — с множеством уровней исправлений. Кроме того, Cobol часто содержит встроенные языки, такие как DMS, DML, CICS и SQL. Так что не существует такого понятия, как «язык Кобол». Это полиглот, запутанная смесь диалектов и встроенных языков — отдельная проблема 500 языков. Во- вторых, согласно Джонсу, установленное в мире программное обеспечение распределяется по языкам следующим образом:
Кобол: 30 процентов (225 миллиардов строк)
• C/C++: 20 процентов (180 миллиардов строк)
• Ассемблер: 10 процентов (от 140 до 220 миллиардов строк ). )
• менее распространенные языки: 40 процентов (280 миллиардов строк)

Поскольку существует около триллиона строк установленного программного обеспечения, написанного на множестве языков , его решение является шагом вперед в управлении этими активами.


2000 г.

20. В мире около двух миллионов программистов на COBOL — более чем в два раза больше, чем программистов на JAVA.


21. По оценкам, более 100 миллиардов строк кода, большая часть из которых написана на языке Cobol , управляет мировой инфраструктурой. Конечным результатом является новая оценка наследия и поиск способов извлечь выгоду из его потенциала.


1996 г.

22. Однако мы только что (январь 1996 г.) приступили к большому проекту, посвященному этой теме, в сотрудничестве с несколькими промышленными партнерами, включая голландский банк ABN-AMRO , и мы считаем, что это приложение слишком интересно, чтобы оставить его без обсуждения в статье. по промышленному применению ASF+SDF. Задача заключается в анализе, очистке и реконструкции большого набора (25 000 программ, 30 млн строк кода) приложений COBOL для мэйнфреймов . В настоящее время изучаются две основные проблемы: преобразование между диалектами COBOL и идентификация и исправление программных ошибок, связанных с «2000 годом».

Многие из этих ссылок просто говорят о существовании отдельных больших кодовых баз или вызывают вопрос («По оценкам Gartner, используется 180 миллиардов строк кода Cobol»). Можете ли вы отредактировать, чтобы указать на какой-то первоисточник?
@LarryOBrien Конечно. Вы ищете средства и методы или подойдет консенсус?
Я бы, конечно, предпочел что-то с опубликованной методологией. Gartner, чтобы назвать главного нарушителя, был довольно ненадежным на протяжении многих лет, но никогда не привлекался к ответственности. Они были одним из главных сторонников чрезвычайно плохого источника и чрезмерно разрекламированного воздействия Y2K (Gartner прогнозировал 300–600 миллиардов долларов прямых затрат, «по крайней мере 1» кражу на сумму более 1 миллиарда долларов, и что 50% организаций потерпите по крайней мере 1 критический сбой из-за Y2K).