Безопасное программирование веб-приложений на языке PHP |
||||
---|---|---|---|---|
В этой работе я постарался собрать и систематизировать наиболее характерные ошибки в написании кода на языке php. Некоторые ошибки отрицательно сказываются на производительности системы, а некоторые предоставляют возможность нарушить целостность данных, или получить доступ к секретной информации. Многие ошибки, приведенные здесь, не являются специфичными именно для php, а являются общими для cgi-программирования. Основные сведения о языке. Одна из наиболее сильных сторон php является, одновременно, и его слабой стороной: php очень прост в изучении. Это привлекает многих людей; однако, несмотря на его кажущуюся простоту, не так-то просто научиться использовать этот язык правильно и эффективно. Язык php был специально разработан для web-программирования, и вопросам безопасности приложений уделялось много внимания, однако некорректная настройка интерпретатора и собственные ошибки php-программиста могут поставить под угрозу ваши разработки. php уже стал зрелым языком, легким в изучении и работающим на многих платформах. Однако за его гибкость и легкость использования приходится платить системными ресурсами. php, как все интерпретируемые языки, должен перед выполнением компилироваться в код, понятный платформе, на которой работает. Интерпретируемый код может сильно ухудшить производительность, особенно на слабой или перегруженной машине, потому что затрачивается много времени на обработку кода. php скрипт работает достаточно быстро, но не так быстро как заранее скомпилированная программа. Интерпретируемый код может сильно ухудшить производительность, особенно на слабой или перегруженной машине, потому что затрачивается много времени на обработку кода. php скрипт работает достаточно быстро, но не так быстро как заранее скомпилированная программа. Интерпретатор php4, который называется zend engine, имеет два компонента: компилятор и исполняющий модуль (как дополнительные модули существуют: сложная система буферизации, значительно ускоряющая частоповторяемые запросы, и многопроходный оптимизатор). Компилятор просматривает ваш скрипт за один проход (в php3 скрипт интерпретируется построчно), компилирует его и затем передает исполняющему модулю. Общие ошибки в разработке. Однако если вы задумываете ваше приложение как полностью объектно-ориентированное, то, возможно, вам следует обратиться к специализированным языкам, таким как python и ruby, или использовать связку php – java. php хоть и поддерживает основные объектно-ориентированные конструкции, но далеко не в полном объеме (не поддерживаются защищенные члены класса, множественное наследие). Если необходимо создание высокопроизводительных приложений, обрабатывающих много запросов в секунду (например, систему баннерной сети), то стоит использовать предкомпилируемые языки. Плохо комментированный код. Все программисты считают самодокументированный код хорошим тоном, но сами крайне редко пишут комментарии. Следует также избегать избыточных комментариев, это тоже встречается очень редко, и, опять же, создает трудно читаемый исходный код. Существует несколько основных принципов: В начале каждого php-файла опишите его предназначения, особенности и принципы
работы, авторские права и другую общую информацию. Наиболее типичные ошибки: Использование переменные, отличающиеся только регистром символов. $username = 'sterling'; Пример плохого именования: $username_for_database = 'sterling'; Переписывание стандартных функций. Например, чтобы разбить строку на части используйте функцию: array explode (string separator, string string [, int limit]) Если вам кажется, что с задачей, которую вам нужно выполнить встречаются многие программисты – посмотрите, наверное, уже существует готовое решение. Нет корректной обработки ошибок. Всегда проверяйте, были ли успешно выполнены системные вызовы, подключения к базам данных, функции, в которых потенциально могут возникнуть ошибки. Например, подключение к базе данных: $conn = @sql_connect ($host, $user, $pass); Причем вместо die() лучше вызвать собственную функцию обработчик ошибки, которая выдаст пользователю внятное объяснения проблемы в виде html странички. Смешан php и html код. Многие рекомендуют объединять код html (интерпретируемый на стороне клиента) и код php (выполняемый сервером) в один большой файл. Для маленьких сайтов это, возможно, неплохо. Но, когда ваш сайт начнет расти, вы можете столкнуться с проблемами при необходимости добавить какие-либо новые функции. Такой стиль программирования приводит к очень «непослушному» и громоздкому коду. Проблему можно решить с помощью создания функций динамического формирования вывода и поместить их в нужное место на веб-странице. Например, так: <?php include_once ("site.lib");
?> Или использовать шаблоны: некоторые элементы дизайна заменяются пользовательскими тегами, а сама программа сканирует файл на предмет их наличия и заменяет их необходимой информацией. Пример использования шаблонов: <html> Применение шаблонов более логично, к тому же редактирование дизайна документа не требует знаний php, однако это все же более медленный способ – ведь надо сканировать весь шаблон, и лишь потом выводить данные (естественно этот процесс автоматизирован – существует несколько готовых библиотек, самая известная из которых fasttemplate). Использование чужого кода, не разобравшись в нем. Так же уделяйте особое внимание комментированию кода, который вы собираетесь использовать в других своих приложениях, или отправить в публичный архив. Используйте источники, которые вызывают доверие, например архив pear (http://pear.php.net/) Дублирование функций базы данных. Например, вместо сортировки средствами php: $statement = "select name, email, phone from some_table
"; Лучше использовать сортировку на стороне сервера БД: $statement = "select name, email, phone from some_table
"; Хотя стоит оговориться, что иногда стоит взять часть нагрузки БД на сторону собственной программы, если БД сильно перегружена. Ошибки, понижающие производительность системы. Это не означает, что при появлении первой альфа версии нужно ее тут же устанавливать (в ней еще могут быть недоработки и еще не найденные разработчиками ошибки), однако постарайтесь не отставать от прогресса. Необоснованное применение функций. Например, функцию printf() следует использовать только для вывода форматированных данных (при необходимости вывода переменной в формате с плавающей запятой с определенной точностью, либо в любом другом случае, когда возникает необходимость изменения формата выводимых данных). Вызов функции printf() зачастую используется там, где следовало бы использовать print(). В следующем примере функция printf() используется для вывода четырех переменных: $name = 'sterling hughes'; В данном случае возможно (и желательно!) применение print(): print "Меня зовут $name\n<br>\n Функция printf() форматирует свои аргументы перед выводом. Таким образом, время ее выполнения больше, чем для функций print() или echo(). Медленная работа с регулярными выражениями. Опять же, если вам нужно только произвести замену в какой-то строке – для повышения быстродействия лучше использовать специализированную функцию str_replace. Слишком много временных переменных. Типичный пример лишней переменной: <?php Когда можно написать просто: <?php Использование временных переменных замедляет выполнение программы. Для
увеличения скорости кода, где это возможно, лучше воспользоваться вложением
функций. Использование временных переменных зачастую увеличивают время
выполнения скриптов почти на четверть. |