Количество строк кода (Lines of code)


Определение

Количество строк кода - часто используемая единица измерения объема и сложности программного проекта. Она применяется также для прогноза трудозатрат при планировании проекта и оценке сроков на стадии разработки, так и для оценки производительности труда после завершения проекта.

Физические и логические строки

Существуют две широко используемые методики подсчета строк: подсчет количества "физических" строк и подсчет количества "логических" строк. Следует учесть, что эти термины не являются точно определенными, и нюансы их значений могут быть различны в конкретных случаях. В общем случае, количество "физических" строк обычно равно количеству строк исходных текстов программы, включая комментарии, и, возможно, даже пустые строки. При подсчете "логических строк" делается попытка подсчета исполнимых выражений (операторов, функций и т.д.), однако определения таких выражений отличаются у различных языков программирования.

Отсюда вытекают плюсы и минусы обоих подходов: количество "физических" строк проще определить, но оно сильно зависит от стиля кодирования и форматирования исходного текста; "логические" строки не имеют такого недостатка, зато их количество довольно тяжело подсчитать.

Пример расчета

Рассмотрим следующий код:

for (i=0; i<100; ++i) printf("%d bottles of beer on the wall\n");
//How many LOCs is here?

В данном случае получается, что в коде содержится 2 физические строки кода, 2 логические строки кода (оператор цикла for и оператор вызова функции printf) и 1 строка комментария.

Если поменять форматирование кода:

for (i=0; i<100; ++i)
{
    printf("%d bottles of beer on the wall\n ");
}
//How many LOCs is here?

то получим уже 5 физических строк кода, но при этом останутся те же 2 логических строки кода и 1 строка комментария.

Количество строк и характеристики программы

Количество строк кода, очевидно, ассоциируется со сложностью системы - чем больше кода, тем она сложнее. Для примера, ядро операционной системы Windows NT 3.1 оценивается в 4-5 миллионов строк кода, а уже Windows XP - 45 миллионов. Количество строк кода в ядре Linux версии 2.6 равняется 5.6 миллионов, а версии 3.6 - уже 15.9 миллионов.

А вот с качеством и надежностью все не так однозначно. В реальном мире все программы содержат ошибки, и скорее всего, чем больше программа, тем больше ошибок. Это довольно очевидное утверждения, если ввести коэффициент "количество ошибок/количество кода" - даже если он будет постоянным, абсолютное число ошибок будет возрастать вместе с ростом программы. А интуиция подсказывает, что при увеличении кода число будет увеличиваться из-за возрастающей сложностью системы (Э. Таненбаум). И не только интуиция (см. график "типичная плотность ошибок"). На подобных соображениях основываются такие принципы разработки, как KISS, DRY, и SOLID. Также можно привести красноречивую цитату классика Э. Дейкстры - "простота - основа надежности", а также отрывок его работы "Плоды непонимания":

...Еще некоторые говорят о программировании как о производственном процессе и измеряют "производительность программиста", основываясь на "произведенном количестве строк кода". Таким образом, они подходят к этому числу с неправильной стороны: всегда нужно понимать его как "затраченное количество строк кода".

Итог

Таким образом, с увеличением количества строк кода программы растет её сложность, и как следствие, количество ошибок. К сожалению (а может, и к счастью), технический прогресс неизбежен и системы будут продолжать усложняться, требуя все больше ресурсов для поиска и исправления ошибок (и, разумеется, в процессе исправления также будут добавляться и новые ошибки), так что использование методики статического анализа и специальных инструментов может помочь в уменьшении количества ошибок и увеличении эффективности всего процесса разработки.

Библиографический список


Найденные ошибки

Проверено проектов
346
Собрано ошибок
13 188

А ты совершаешь ошибки в коде?

Проверь с помощью
PVS-Studio

Статический анализ
кода для C, C++, C#
и Java

goto PVS-Studio;