Обеспечение безопасности и надёжности в системах промышленных вычислений
Обнаружение неисправностей в реальном времени и проектирование отказоустойчивой архитектуры
Контроль за промышленными вычислительными системами абсолютно необходим, если мы хотим избежать полного отказа системы. Большинство объектов оснащены резервными источниками питания с автоматическими переключателями ввода (ATS), а также сторожевыми таймерами, встроенными непосредственно в аппаратное обеспечение. Эти компоненты совместно обеспечивают переключение операций при возникновении неисправностей, благодаря чему система восстанавливается практически мгновенно без необходимости ручного вмешательства и устранения проблем. В настоящее время серьёзные промышленные установки способны работать без сбоев более 100 000 часов. А помните цифры, опубликованные Институтом Понемона в прошлом году? Они показали, насколько дорогостоящим является незапланированное простои для производственных предприятий — порядка 740 тыс. долларов США за каждый час. Это делает инструменты диагностики в реальном времени не просто желательным, а практически обязательным элементом повседневной эксплуатации. Наилучшие конструкции систем аварийной защиты сочетают физические методы защиты — например, защитные конформные покрытия печатных плат и специальные крепления, устойчивые к вибрациям — со «умным» программным обеспечением, способным прогнозировать неисправности до их возникновения. Такое сочетание позволяет системам безопасно завершать работу до того, как изношенные компоненты вызовут более серьёзные проблемы.
Соответствие нормативным требованиям в соответствии с IEC 61508, ISO 13849 и NIST SP 800-82
Когда речь заходит о функциональной безопасности и кибербезопасности, они должны работать вместе с самого начала, а не добавляться как второстепенные элементы после того, как всё остальное уже построено. Возьмем, к примеру, IEC 61508, которая предусматривает компоненты с рейтингом SIL 3 при работе в опасных ситуациях. Затем есть ISO 13849, требующая уровней производительности e (PL e) для систем безопасности машин. И нельзя забывать о NIST SP 800-82, устанавливающем базовые требования к кибербезопасности промышленных систем, включая такие аспекты, как шифрование данных и управление доступом на основе пользовательских ролей. Согласно данным ISA-99, почти 4 из 10 проблем с безопасностью фактически возникают из-за слабой практики проверки на этапе разработки. Именно поэтому соблюдение норм имеет важное значение на всех этапах проекта — от первоначального проектирования до тестирования. Компании, которые с самого начала придерживаются этих стандартов, как правило, снижают свои общие затраты в течение жизненного цикла примерно наполовину. Почему? Потому что стандартизация документации становится проще, контрольные журналы можно автоматизировать, и просто меньше необходимости возвращаться назад и исправлять ошибки позже.
Обеспечение бесшовной совместимости в различных промышленных вычислительных средах
Интеграция устаревших систем OT/IT в промышленных вычислительных установках на действующих объектах
Совмещение устаревших операционных технологий (OT) с современными ИТ-системами по-прежнему является, вероятно, самой большой проблемой при модернизации старых промышленных установок. Большинство предприятий сталкиваются с проприетарными протоколами и устаревшим оборудованием, что вынуждает их прибегать к дорогостоящим, хрупким решениям промежуточного программного обеспечения, которые лишь замедляют процессы и увеличивают затраты на техническое обслуживание. Согласно недавнему отраслевому отчёту по автоматизации за прошлый год, примерно две трети производителей сталкиваются с задержками в производстве во время интеграции из-за того, что их системы не могут корректно взаимодействовать друг с другом. Что работает лучше всего? Внедрение пограничных шлюзов, поддерживающих протоколы, вместе с преобразователями полевой шины в Ethernet. Эти устройства сохраняют критически важные временные требования, обеспечивая при этом безопасную двустороннюю связь между системами. Такой подход позволяет сохранить ценность старого оборудования и создаёт надёжную основу для расширения возможностей промышленной аналитики без необходимости полной замены всей инфраструктуры с нуля.
Пробелы в использовании OPC UA и проблемы семантической интероперабельности
OPC Unified Architecture, или OPC UA, как это обычно называют, стала практически стандартом де-факто для обеспечения связи между системами различных производителей через разные платформы в промышленной среде. Но есть одно «но»: реальная семантическая совместимость до сих пор так и не достигнута. Проблема особенно очевидна, когда оборудование от нескольких производителей работает в одной сети. Возникает множество проблем, поскольку разные компании используют собственные схемы наименований, информационные модели не согласованы, а метаданные зачастую теряются. Эти проблемы вызывают конфликты пространств имён, возникающие примерно в 40 % установок. И что при этом происходит? Каждому затронутому узлу обычно требуется от 30 до 50 дополнительных часов ручной настройки. Для достижения истинной функциональности plug-and-produce промышленность нуждается в нейтральных к поставщикам сопутствующих спецификациях, а также в решениях для общего хранения метаданных. Простого прохождения сообщений уже недостаточно. Когда контекстуальные данные теряются во время передачи, это нарушает работу важных приложений IIoT, таких как системы прогнозирующего технического обслуживания. В конце концов, такие системы зависят от понимания реального смысла данных, а не просто от факта доставки сообщений без повреждений.
Управление данными в масштабе для промышленных вычислений в реальном времени
Потоки данных с учетом задержек, поддерживающие циклы управления менее 10 мс
В промышленных условиях вычислительные системы должны работать в строго ограниченные временные рамки. Когда речь идет о таких процессах, как роботизированная сварка, точные операции дозирования или управление движением по замкнутому циклу, система должна реагировать от входного сигнала датчика до выходного сигнала на исполнительное устройство менее чем за 10 миллисекунд. Современные производственные площадки генерируют около 25 тысяч показаний данных каждую секунду. Такой объем данных серьезно нагружает традиционные ИТ-инфраструктуры. В настоящее время многие заводы переходят на решения граничных вычислений (edge computing). Эти локальные вычислительные устройства обрабатывают телеметрические данные непосредственно в месте их возникновения, что снижает зависимость от удаленных облачных сервисов и устраняет надоедливые задержки, которые, по данным исследования института Ponemon за 2023 год, могут обходиться руководителям предприятий примерно в 740 тысяч долларов в час. Для обеспечения синхронизации между реальным оборудованием и его цифровыми двойниками особенно важны базы данных временных рядов, предназначенные для быстрого приема данных. В сочетании с надежными методами планирования и специализированным оборудованием для точной временной привязки такие решения позволяют производителям достичь лучшего соответствия между тем, что происходит на производстве, и тем, что отображается в системах мониторинга.
Ключевые приоритеты реализации включают:
- Строгий приоритет сигналов управления по сравнению с несущественной телеметрией
- Поддержка параллельной обработки для согласованного движения по нескольким осям
- Проверка временных меток между узлами для обеспечения временной целостности
- Легковесное сжатие, исключающее задержки из-за вычислительных операций
Эти меры обеспечивают реагирование в режиме реального времени и позволяют осуществлять непрерывную оптимизацию процессов.
Оптимизация архитектуры «пограничные устройства – облако» для промышленных вычислительных задач
Гибридный подход, сочетающий вычисления на периферии и облачные сервисы, предоставляет организациям необходимые преимущества: быструю реакцию непосредственно там, где происходят события, а также возможность масштабирования при необходимости в облачной среде. Для критически важных операций, которые нельзя откладывать, таких как проверка машинного зрения на производственных линиях, управление сервоприводами в производственном оборудовании или работа систем безопасности, требующих немедленной реакции, эти задачи выполняются локально, что значительно сокращает задержку — с 100–500 миллисекунд до менее чем 10 миллисекунд. В то же время более ресурсоемкие вычислительные задачи, которым не требуется мгновенный результат, включая анализ исторических тенденций, обучение моделей искусственного интеллекта или выявление аномалий на множестве устройств, обрабатываются с использованием облачных ресурсов. Такое разумное распределение позволяет сэкономить около 60 процентов сетевой пропускной способности по сравнению с исключительно облачными решениями. Успешная реализация этого подхода зависит от продуманного выбора места выполнения каждой задачи с учетом таких факторов, как перемещение данных между системами, требования безопасности и совместимость, а не просто из соображений удобства или следования прежней практике. Каждая часть приложения требует тщательного анализа: необходимо определить, обязательно ли её выполнение на периферии для предсказуемой производительности или она принесёт больше пользы, если будет обрабатываться в масштабах облака для анализа и хранения.
Масштабирование промышленного искусственного интеллекта: от экспериментальных проектов до готовых к серийному производству вычислительных систем
Преодоление нехватки данных, шумов в разметке и смещения домена в машинном обучении на производстве
Переход от экспериментальных проектов с использованием ИИ к полноценному внедрению означает необходимость решения ряда фундаментальных проблем с данными, характерных для промышленной среды. Начнём с ограниченной доступности данных. Редкие поломки оборудования происходят слишком нечасто, чтобы на их основе можно было создать качественные обучающие наборы. Большинство производителей сталкиваются с этой проблемой: лишь около 5 % ведут полную документацию по отказам оборудования для задач предиктивного обслуживания. Далее — проблема нечётких меток. Люди, размечающие данные, зачастую действуют непоследовательно, а показания датчиков со временем могут смещаться, что искажает обучение ИИ. Были случаи, когда подобные ошибки в разметке снижали точность моделей почти на треть в реальных условиях. И, наконец, сложность меняющейся внешней среды. Модели, отлично работающие в контролируемых лабораторных условиях, зачастую полностью терпят неудачу при внедрении на реальных предприятиях, где оборудование изнашивается, температура постоянно колеблется, а производственные процессы отличаются изо дня в день. Чтобы справиться с этими проблемами, компаниям необходимо генерировать синтетические данные для сложных пограничных случаев, внедрять интеллектуальные стратегии аннотирования, ориентированные на наиболее ценные точки данных, а также разрабатывать методы, позволяющие моделям адаптироваться к различным условиям эксплуатации. Только так можно обеспечить надёжность систем ИИ и их понятность для операторов перед лицом непредсказуемости реального производства.
Часто задаваемые вопросы
Почему архитектура с функцией безопасного состояния важна в промышленных вычислительных системах?
Архитектура с функцией безопасного состояния имеет решающее значение для предотвращения полного отказа системы в промышленных вычислительных системах. Использование резервных источников питания, автоматических переключателей и диагностических инструментов позволяет системам быстро восстанавливаться после сбоев, минимизируя затраты из-за простоев.
Какие основные стандарты регулируют соответствие требованиям в промышленных вычислительных системах?
Ключевые стандарты включают IEC 61508 по функциональной безопасности, ISO 13849 по системам управления безопасностью машин и NIST SP 800-82 по требованиям кибербезопасности. Соблюдение этих стандартов помогает снизить затраты на жизненный цикл и обеспечивает соответствие проектов нормативным требованиям по безопасности и защите.
С какими трудностями связано обеспечение совместимости между устаревшими OT-системами и современными IT-системами?
Основная проблема заключается в интеграции разрозненных устаревших систем, использующих проприетарные протоколы, что приводит к необходимости дорогостоящих решений на основе промежуточного программного обеспечения. Внедрение пограничных шлюзов и преобразователей, учитывающих протоколы, может эффективно устранить этот разрыв.
Какие пробелы существуют в использовании OPC UA для промышленных вычислений?
Семантическая совместимость остается серьезной проблемой. Различия в соглашениях об именовании и метаданных могут вызывать конфликты, требуя значительной ручной настройки. Для достижения истинной совместимости необходимы общие решения по хранению метаданных и спецификации, независимые от производителей.
Как вычисления на границе сети (edge computing) способствуют управлению данными в реальном времени в промышленных условиях?
Вычисления на границе сети позволяют обрабатывать данные локально, снижая задержки и зависимость от облачных сервисов. Такая архитектура обеспечивает бесперебойную работу операций в реальном времени, таких как роботизированная сварка, с немедленным временем отклика.
Содержание
- Обеспечение безопасности и надёжности в системах промышленных вычислений
- Обеспечение бесшовной совместимости в различных промышленных вычислительных средах
- Управление данными в масштабе для промышленных вычислений в реальном времени
- Оптимизация архитектуры «пограничные устройства – облако» для промышленных вычислительных задач
- Масштабирование промышленного искусственного интеллекта: от экспериментальных проектов до готовых к серийному производству вычислительных систем
-
Часто задаваемые вопросы
- Почему архитектура с функцией безопасного состояния важна в промышленных вычислительных системах?
- Какие основные стандарты регулируют соответствие требованиям в промышленных вычислительных системах?
- С какими трудностями связано обеспечение совместимости между устаревшими OT-системами и современными IT-системами?
- Какие пробелы существуют в использовании OPC UA для промышленных вычислений?
- Как вычисления на границе сети (edge computing) способствуют управлению данными в реальном времени в промышленных условиях?