Shanghai Richeng Electronics Co. Ltd - ISO9001/IATF16949/ISO/TS22163
Choose Language

Wiring duct,Cable Gland,Cable Tie,Terminals,RCCN

自动化上位服务器的冗余

今天,很多工程师对DCS和PLC的CPU冗余、电源冗余、输入/输出模块冗余、甚至网络冗余已经有所了解了,它们位于自动化系统的1层(Level 1),见下图,现在我们来讨论一下2层和以上部分的冗余问题。这些部分包括:监控与数据采集(SCADA)、制造执行系统(MES)和企业资源计划(ERP)等系统。

 
工业自动化需要高等级的可靠性,这个需求扩展到计算硬件和软件--也具有高可用性。在低层系统,组件使用高可用性设计,诸如嵌入式控制器,已经有多年的历史。但今天的人们期望自动化系统能执行更多的任务-诸如与后端数据库交换信息-成为不断集成和智能架构的一部分。
比如一家汽车生产商,在安装安全气囊时,需要记录每个装配螺钉的转矩值,并把这个信息发送到公司的数据库。如果这个数据在制造过程中变得不靠谱,在系统运行时引起失效,后果会非常严重。为了在制造过程中找出不能满足规范的原因,工厂可能不得不停止生产线,请相关技术人员查找问题所在。对于某些流程行业,诸如制药行业,糟糕的数据可能意味着一整批已经生产的产品必须废弃。 
因为自动化系统要做很多的事情,所以系统变得非常复杂。公司必须经常对系统进行评估,发现问题所在,找出提高效率方法,在计算架构中建立高可靠性和高可用性的冗余是减少停机时间、提高整体生产率的方法之一。
建立高可用性
为了找到在一个系统中需要的冗余点,最好从有软件环境的高层开始。考查高层子系统,诸如数据库和管控台,对需要高可用性的地方进行优先排序。如果一个特定的子系统需要连续的信息更新,数据存储对这个子系统而言,应该具有高可用属性。相反,管控台为操作员提供人机界面,能够与现场信息互动,反应速度不是很快,所以不需要最高的可用性。
下一步是对多个子系统制定不同可用性等级的策略。如果某个数据库必须要高可用性,并且由多个服务器支持,功能怎样分布到各服务器-特别是如果其中的一台失效了怎么办?这些都是策略要考虑的问题。对服务器实施高可用性有几种可选方法,包括软件和硬件的解决方案。 
在软件领域,市场销售的操作系统和数据库很多都包含了群件功能,这意味着在集群机器中,能够实现从失效节点到不同节点的自动切换。很多虚拟化产品也具有这样的切换能力,这个功能能使企业快速启动应急预案,执行备份解决方案,自动调出新的虚拟实例,这是在配置时事先要完成的特定角色。 

 
虚拟化允许不同类型的软件栈使用统一的方法管理,这在老子系统和新子系统需要共存的情况下,是非常适合的。当失效发生时,同类系统的单一应用框架能够把需要的预备应用切到一个新服务器上。
这些解决方案的每个性能都不一样,差别巨大。一个全部冗余的硬件集群方案仅需要1秒或2秒完成切换,而由一个应用容器检查到问题,然后转移至一个新服务器可能需要30秒。选择方案是否能满足响应要求在设计阶段是非常关键的,因为要改变一个冗余的架构层,可能需要对整个系统重新设计一次。
要注意的是,在集群的子系统内操作时,需要坚持一些原则,诸如最小化状态和无扰动切换。有可能的话,使服务中的状态信息最小化,并存放在公共存储器中。对于不能完全转移到公共存储器的信息,非易失性存储结合一种复制策略,可以实现节点失效的影响最小化。
当一个托管数据库实例系统停机时,他可能处于最后交易的一半写状态。当新节点接入后,方案应设计成能够滚动返回操作,已交易部分应避免重复输入,不然会使记录的不正确率增高。错误数据的影响可能是灾难性的。如果不能找到制药生产过程的正确历史,制造商可能不得不召回一整批次产品,价值可能有几百万美元。
配置硬件冗余
系统除了在软件级上建立高可用性外,硬件应确保不会因任意单点失效而使系统宕机。企业应能通过硬件冗余防止系统失效,并能实现在线可维护。在服务器级,冗余是确保运行连续、可靠计算和数据安全的基础。 
冗余硬件的组件应该包括:
● 冗余服务器和热插拔机架、冷却风扇;
● 冗余机架管理模块;
● 标准N-1冗余,热插拔电源;
● 可选冗余随机存储器(RAM);
● 带热插拔硬盘的冗余存储;
● 电池支持的磁盘冗余阵列(RAID)缓存;
● 冗余网络接口;
● 冗余热插拔更换模块。

 
决定在哪里投资
冗余是避免的中断和宕机的基础,特别在自动化的制造和生产中。但很少有组织在每个运行部分建立相同等级的冗余,这是因为资金和资源都是有限的,另外对不同子系统可用性的要求也是不一样的。由于基础设施的不断集成和智能化,公司有机会不断改变系统的架构,可用性不但依靠处理器和存储器,也要依靠建立的数据库、接口和应用的冗余。

 
关键是选择在哪里实施冗余。从整个系统的开始,评估哪个子系统需要高可用性,结合考虑软件环境和硬件域,企业能够达到他们所需要的高可用性,同时降低停机造成的损失。

Related articles

Previous: 我们为什么要学单片机?
Next: 传感器的设计注意事项
On-line
contact
message
download
Print
WeChat WeChat
Collection
TOP