引 言
在对实时收集更新的数据进行处理时,往往会遇到数据更新速度与数据处理的速度不匹配的问题。这种状况下,会呈现数据丢掉而导致数据处理结果不精确,甚至会带来不行猜测的结果,因此需求一种机制来和谐数据更新与数据处理,然后保证数据的完整性和处理结果的精确性。作为一个多任务、多用户操作体系,Linux 支撑多个进程在体系中并发运转,因为进程自身的动态特性,用来描绘实时数据处理十分适宜,因此,处理好Linux进程间的同步与通讯问题就能处理实时数据处理的问题。
在Linux环境下,进程一般存在运转(running)、堵塞(blocked)、安排妥当(ready)、停止(terminated)四种状况。当多个进程并发履行时,往往会呈现进程间的竞态。咱们期望进程能和谐彼此间的行为,使得一个进程只需在其他的进程履行到一个特定的点时才会履行一个动作,即操控同步;一起,当并发进程拜访同享数据时不该当呈现竞赛条件。这一点经过在拜访同享数据时履行互斥来保证,即数据拜访同步。
完结同步的根本技能是堵塞一个进程,直到一个特定条件满意停止;完结数据拜访同步是经过堵塞一个进程直到别的的进程完结拜访同享数据。
1 有限长度缓冲区的出产者一顾客问题模型
当仅存在单个出产者和顾客时,出产进程和消费进程所对应的是相同的数据结构,它们同享同一个数据空间。出产进程和消费进程怎么进行彼此和谐,使得消费进程每次运用的数据都是出产进程新出产写人的,又使出产进程新写入的数据不会掩盖还未被消费进程读出运用的数据,是该问题模型完结的关键问题。
在出产者一顾客问题模型中,出产者进程不断出产产品并把它们放入缓冲区,顾客进程不断从缓冲区中取走产品进行消费。当缓冲区中产品现已放满时,表明出产速度高于消费速度,呈现了供过于求,此刻出产者有必要等候产品被消费;当缓冲区为空时,表明消费速度高于出产速度,呈现了求过于供,此刻顾客进程有必要等候产品的出产。出产和消费的进程有必要到达同步运转,才干完结供需平衡。
处理读写同步的两种常见的战略被称为“强读者同步(strong reader synchronization)”和“强写者同步(strongwriter synchronizaTIon)”。在强读者同步中,总是给读者以优先权,只需写者当时没有进行写操作,读者就能够取得拜访权;在强写者同步中,写者总是取得优先权,只需强读者当时没有进行读操作,写者就能够取得拜访权。而出产者顾客同步与单纯的读写同步又有不同,顾客能够经过拜访资源对资源进行删去或毁掉。
一个有限长度缓冲区的出产者顾客问题模型,是由若干出产者和顾客进程以及一个有限的缓冲池构成的。每个缓冲区能够存储一个信息记载,一个出产者一次出产一个信息记载。发生一个记载之后,等候独自进入一个空的缓冲区后将记载写入缓冲区。一个顾客进程一次消费一个信息记载。当它需求消费时,它等候独自进入一个满的缓冲区后将记载读出。
经过上面的描绘能够得出,处理出产者一顾客问题模型的计划需求满意以下几个条件:
◇出产者不该掩盖一个满的缓冲区;
◇顾客不该运用一个空的缓冲区;
◇出产者和顾客应按互斥方法拜访数据缓冲区;
◇数据有必要依照先进先出(FIFO)方法;
◇不能呈现忙等候。
有必要防止数据写进程不断、重复地查看缓冲区直到找到一个空缓冲区停止,而读进程也有必要防止不断查看直到找到一个满缓冲区停止。这相当于体系内部发生忙等候,是在仅运用临界段(CS)算法完结进程同步时难以防止的问题。
针对问题模型处理计划的约束条件,选用信号量方法处理实时更新数据处理的进程同步问题,即上述的出产者一顾客问题模型。
信号量是一个非负值的同享整数值,只能用于初始化和不行分操作。不行分操作是指在对一个数据D进行操作时不能与任何其他对D的操作堆叠的操作。界说操作P 和V为不行分操作。P和V的不行分性意味着这些操作不能并发履行,防止了对信号量的竞赛条件。界说P和V的操作语义为:
由上述界说的语义看,对一个信号量S的操作,P和V为改动S的值,或许挂起或唤醒一个对S进行P操作的进程。被挂起的进程为堵塞状况,因此防止了忙等候问题。一个二进制的信号量只取0和1,用来完结互斥。
在P和V操作中,对进程的堵塞和唤醒需求操作体系的进程办理组件的参加,因此信号量会被操作体系完结而不是应用程序完结。
出产者一顾客问题模型描绘:
2 结构规划
关于有限缓冲区的出产者顾客问题模型的履行包含以下部件:同享数据一缓冲区组、操作一缓冲区的拜访、进程一出产者顾客。
在出产者一顾客同步中,由出产者创立资源,与单纯的读程序不同,顾客能够经过拜访资源,将资源删去或毁掉。因为出产者进程和顾客进程同享一个缓冲区,因此在刺进和删去条目时有必要同步。完结中有必要防止表l所列的同步反常问题。
出产者一顾客问题的传统的信号量处理计划运用了2个信号量,别离用来表明缓冲区中的条目数和闲暇槽的数目。当进程需求特定类型的资源时,它能够经过函数调用对相应的信号量进行减量操作;相同,当进程开释资源时,它能够经过函数调用来对相应的信号量进行增量操作。因为信号量永久不会降到零以下,所以进程不能运用不存在的资源。因此,一直将计数信号量初始化为开端时可用的资源数。
界说循环行列缓冲区寄存待处理数据,操控台数据处理进程从该循环行列缓冲区中消费数据,并将该数据存储位标记为“抛弃”。数据收集写进程仅能将数据寄存于标记为“抛弃”的循环行列缓冲区中,如图1所示。
在没有多个出产者或顾客的状况下,假如细心完结,循环缓冲区就不需求锁。出产者是仅有答应批改写入索引以及该索引指向的数组方位的进程。只需写入者在更新写入索引之前将新的值保存到缓冲区,则读取者将一直看到共同的数据结构;一起,读取者是仅有能够拜访读取索引以及该索引指向方位的数据的进程。只需保证两个指针不要相互堆叠,出产者和顾客能够在无竟态的状况下拜访该缓冲区,如图2所示。
关于只需单个出产者和顾客,经过运用批改的运用信号量方法的出产者一顾客问题模型处理计划来完结。
以上用信号量方法处理了优先缓冲区问题,信号量“empty”和“full”的值别离指示空和满的缓冲区的数量,如图3所示。缓冲区指针i和j用来保证缓冲区按先进先出的次序供给并运用。只需体系中存在一些满的和空的缓冲区,数据更新进程和数据处理进程就能无竞态并发履行。笔者在华恒ARM嵌入式渠道 HHARM2410-R5上依照上述计划成功完结了用例测验。
3 评论
以上的结构规划,将出产者与顾客别离简化为一个。当存在多个出产者和顾客的状况时,能够上述批改的处理计划为根底,规划多个计数器来计算并行读者(reader)、并行写者(writer)、读者或待读者(pre_reader)、写者或待写者(pre_writer)的数量。计数器的值在进程中的相应方位进行增减。读者和写者在被答应阅览和写入之前有必要被堵塞,这能够经过P操作来完结。当读者或写者在进程被堵塞时操控开端阅览或书写的条件并未满意。这些条件跟着恣意一个计数器值的改动而改动,所以,进程在完结阅览或书写后有必要履行相应的V操作。
在实施多读、多写进程同步处理计划时,有必要要防止不同计数器的竞赛条件,因此有必要在临界段(CS)中履行对答应读或写操作条件的查看。