Сисадмины отвечают за широкий круг обязанностей. Поэтому нельзя сказать, что есть какая-то одна основная задача системных администраторов.
Системные администраторы имеют решающее значение для надежной и успешной работы организации, ее центра сетевых операций и центра обработки данных. Сисадмин должен обладать опытом работы с базовой платформой системы (например, Windows, Linux). А также разбираться во многих областях, включая сетевые технологии, резервное копирование, восстановление данных, ИТ-безопасность, работу с базами данных, основы промежуточного ПО, балансировку нагрузки и многое другое. Задачи сисадмина не ограничиваются управлением, обслуживанием и ремонтом серверов. Сюда также входят любые функции, которые поддерживают бесперебойную работу производственной среды с минимальным количеством (или полным отсутствием) жалоб со стороны клиентов и конечных пользователей. Хотя у сисадминов, казалось бы, бесконечный список обязанностей, некоторые из них более важны, чем другие. Если вы работаете в роли сисадмина (или надеетесь когда-нибудь стать им), убедитесь, что вы готовы следовать этим лучшим практикам.
Основная задача системных администраторов: документация
Документация – это способ, с помощью которого системные администраторы ведут учет активов. Включая типы аппаратного и программного обеспечения, количество и лицензии. Если в производственной среде возникнут проблемы, документация поможет определить, с каким оборудованием, виртуальной машиной, устройством, программным обеспечением и т. д. они могут быть связаны.
Основная задача системных администраторов: инвентаризация оборудования
Еще одна основная задача системных администраторов – ведение списков всех физических и виртуальных серверов со следующей информацией:
- ОС. Linux или Windows, гипервизор с версиями
- Оперативная память. Слоты DIMM в физических серверах
- CPU. Логические и виртуальные процессоры
- Жесткий диск. тип и размер жестких дисков
- Внешнее хранилище (SAN/NAS). Марка и модель хранилища с IP-адресом управления и IP-адресом интерфейса.
- Открытые порты. Порты, открытые на стороне сервера для входящего трафика
- IP-адрес. IP-адрес управления и интерфейса с VLANs
- Инженерные устройства. например, Exalogic, PureApp и т.д.
Основная задача системных администраторов: проверка работоспособности сервера
Запущенные процессы. Сисадмины проверяют процессы, которые потребляют больше ресурсов, чем ожидалось. И принимают меры по тонкой настройке приложений (с помощью команды разработчиков приложений).
Загрузка процессора. Постоянно контролируют и проверяют загрузку процессора критических процессов. Например, таких как “java”, “http”, “mysql” и т. д.. Это нужно чтобы убедиться, что они не потребляют ресурсы процессора больше, чем ожидалось. Если это так, то сисадмины координируют свои действия с командой разработчиков приложений, чтобы проверить их на уровне приложений и отрегулировать. Параллельно при это анализируя такие параметры ОС, как “Ulimits”.
Использование памяти. Проверяют использование памяти и при необходимости очищают кэш.
Зомби-процессы. Проверяют процессы, PID которых все еще существует в таблице процессов после их завершения. Зомби-процессы снижают производительность сервера, поэтому необходимо найти и уничтожить все существующие.
Средняя нагрузка. Если у возникают проблемы с производительностью, проверяют среднюю нагрузку и настраивают сервер на производительность.
Используют диски/сети/накопители. Проверяют отчеты ввода-вывода для внешних подключенных хранилищ. Это нужно чтобы отследить и проверить скорость операций чтения/записи. Если обнаруживаются какие-либо проблемы, координируют свои действия с командами хранилища и сети для их устранения.
Основная задача системных администраторов: планирование резервного копирования и аварийного восстановления
Сисандмины связываются с командой резервного копирования и сообщают им приоритеты данных и клиентов для резервного копирования. Рекомендуемые критерии резервного копирования для производственных серверов следующие:
- Инкрементное резервное копирование. Ежедневно, с понедельника по пятницу.
- Полное резервное копирование. суббота и воскресенье.
- Учения по аварийному восстановлению. Раз в месяц (предпочтительно, а при необходимости – раз в квартал) проводить тренировки по восстановлению вместе с командой резервного копирования. Это необходимо, чтобы убедиться, что данные могут быть восстановлены в случае возникновения проблем.
Основная задача системных администраторов: патчи
Патчи для операционных систем, устраняющие известные уязвимости, должны быть внедрены незамедлительно. Существует множество типов и уровней патчей, включая:
- Безопасность
- Критический
- Умеренный
При выпуске исправления проверяется подробная информация об ошибке или уязвимости, чтобы понять, как она относится к системе. Например, влияет ли уязвимость на аппаратное обеспечение системы. И предпринимаются все необходимые действия для применения исправлений, когда это потребуется. Обязательно нужно проверять совместимость приложений с исправлениями и обновлениями.
Основная задача системных администраторов: совместимость приложений
Перед запуском любого приложения системные администраторы проверяют его совместимость с оборудованием и операционной системой. И обязательно проводят нагрузочное тестирование (при поддержке команды разработчиков).
Защита серверов от внешних воздействий
Далее перечислены советы для системных администраторов по защите серверов от внешних воздействий:
Linux:
- Установите пароль BIOS. это не позволит пользователям изменять настройки BIOS.
- Установите пароль GRUB. это не позволит пользователям изменять загрузчик GRUB.
- Запретить root-доступ. Отказ в root-доступе минимизирует вероятность вторжения.
- Пользователи Sudo. Создайте пользователя sudo и назначьте ограниченные привилегии для вызова команд.
- TCP-обертки. Это оружие для защиты сервера от хакеров. Примените правило для демона SSH, чтобы разрешить доступ к серверу только доверенным узлам и запретить всем остальным. Примените аналогичные правила для других служб, таких как FTP, SSH File Transfer Protocol и т. д.
- Firewalld/iptables. Настройте правила firewalld и iptables для входящего трафика на сервер. Укажите конкретный порт, IP-адрес источника и IP-адрес назначения, а также разрешите, отклоните, запретите ICMP-запросы и т. д. для публичной и частной зон.
- Антивирус. Установите антивирусное программное обеспечение и регулярно обновляйте определения вирусов.
- Защита и аудит журналов. Регулярно и по мере необходимости проверяйте журналы.
- Ротация журналов. Храните журналы в течение ограниченного периода времени, например “в течение 7 дней”, чтобы сохранить достаточно места на диске для безупречной работы.
Windows:
- Установите пароль на BIOS. Это не позволит пользователям изменять настройки BIOS.
- Антивирус. Установите антивирусное программное обеспечение и регулярно обновляйте определения вирусов.
- Настройте правила брандмауэра. Предотвратите доступ неавторизованных лиц к вашим системам.
- Запретите вход администратора. Ограничьте возможность пользователей вносить изменения, которые могут повысить уязвимость ваших систем.
Основная задача системных администраторов: использование сервера syslog
Настроив в среде сервер syslog для ведения записей системных журналов и журналов приложений, в случае вторжения или проблемы системный администратор сможет проверить предыдущие журналы и журналы реального времени, чтобы диагностировать и решить проблему.
Основная задача системных администраторов: автоматизация
Многие задачи системного администратора (такие как проверка состояния сервера, использование ресурсов, триггеры резервного копирования, передача файлов и журналов и т. д.) должны выполняться в определенное время. Поэтому системный администратор должен писать сценарии или использовать внешние инструменты и настраивать их как задания cron для автоматического выполнения задач в нужное время.
Основная задача системных администраторов: инструменты мониторинга
Системный администратор должен установить и настроить инструменты мониторинга. Например такие как Nagios, HP и т. д.. Это нужно для наблюдения за ИТ-инфраструктурой и выдачи предупреждений о потенциальных проблемах.
Заключение
Несмотря на то что это самые важные задачи, стоящие перед системным администратором, его роль гораздо больше, чем просто обязанности из этого списка.
Например, системный администратор должен координировать работу нескольких команд для решения проблем, общаться с клиентами и информировать их, поддерживать 100-процентную работоспособность, проводить обсуждения с аудиторской группой, готовить еженедельные, ежемесячные и ежеквартальные отчеты, осуществлять постоянный мониторинг серверов и служб с помощью соответствующих инструментов, обслуживать консоль оборудования и реагировать на любые срабатывания сигнализации.
Сисадмин всегда является единой точкой оповещения (SPOC) в центре обработки данных или центре сетевых операций по вопросам, связанным с веб-хостингом, сбоями в работе приложений и серверов и другими критическими проблемами ИТ-операций.