Разница в openjdk-6, openjdk-7 и openjdk-8 с точки зрения количества SLOC?

Я вычисляю количество SLOC (Source Lines of Code) некоторых пакетов для моих исследовательских целей. Я загружаю исходные пакеты для разных лет из снимков Debian. Для большинства пакетов количество SLOC увеличивается с каждым годом, как для Wireshark в 2010 году. SLOC меньше, чем в 2011 году, больше и продолжает расти до 2018 года.

Но для OpenJDK 6, 7 и 8 все по-другому. openjdk-7 имеет меньшее количество SLOC, чем openjdk-6 . openjdk-8 имеет меньшее количество SLOC, чем openjdk-7 . Почему это так?

Есть ли проблема в снимках Debian? Возможно, полный исходный код недоступен, или это вообще так для этого пакета?

    Если вы посмотрите на содержимое исходных пакетов OpenJDK, то увидите, что большая часть их исходного кода поставляется внутри tar-архивов внутри пакетов. Если вы запустите SLOCCount Дэвида А. Уилера только для извлеченного исходного кода пакета, он не будет считать код в этих архивах, поэтому вы получите очень частичный счет.

    Чтобы правильно сравнить размеры исходного кода, вам нужно извлечь sloccount перед запуском sloccount . Это дает следующую статистику (в версиях, которые я проанализировал):

      openjdk-6 openjdk-7 openjdk-8 java: 2860304 (68.33%) 3232714 (72.32%) 3601973 (67.00%) cpp: 648574 (15.49%) 671628 (15.03%) 892040 (16.59%) ansic: 584813 (13.97%) 466742 (10.44%) 374378 (6.96%) sh: 49935 (1.19%) 45608 (1.02%) 32891 (0.61%) xml: 23937 (0.57%) 25927 (0.58%) 456037 (8.48%) objc: 13062 (0.29%) 13557 (0.25%) asm: 14125 (0.34%) 11555 (0.26%) 3508 (0.07%) perl: 2258 (0.05%) 1220 (0.03%) 198 (0.00%) pascal: 1089 (0.03%) awk: 631 (0.02%) 687 (0.02%) 367 (0.01%) python: 310 (0.01%) 310 (0.01%) 800 (0.01%) haskell: 195 (0.00%) 195 (0.00%) sed: 172 (0.00%) cs: 72 (0.00%) 72 (0.00%) 72 (0.00%) ruby: 44 (0.00%) 44 (0.00%) jsp: 24 (0.00%) 24 (0.00%) 24 (0.00%) csh: 3 (0.00%) 3 (0.00%) 3 (0.00%) 

    показывая увеличение размера (однако обратите внимание, что область действия пакетов со временем тоже изменилась).