音頻傳輸方案(視頻傳輸解決方案)
視頻會議系統的主流解決方案和技術趨勢
視頻會議系統的關鍵技術
視頻會議系統傳輸多媒體數據,聲音和運動圖像的源信號數據量大,一般情況下無法在數字線路上傳輸。同時,基于實際使用效果的要求,要求傳輸的聲音和圖像信號連續流暢,其他輔助功能易于使用。因此,在聲音/圖像壓縮、通信線路條件、數據/應用共享等方面,對系統有很高的技術要求。本文將對視頻會議的主要技術、解決方案、未來技術趨勢和網絡技術標準進行探討,希望能為該領域的研究人員提供參考。
1)多媒體信息處理技術
多媒體信息處理技術主要是對各種媒體信息進行壓縮和處理。視頻會議的發展也反映了信息處理技術,尤其是視頻壓縮技術的發展。目前,新的理論和算法不斷推動多媒體信息處理技術的發展,進而推動視頻會議技術的發展。特別是在網絡帶寬不豐富的情況下,多媒體信息壓縮技術已經成為視頻會議中最關鍵的問題之一。
與基于PC的CPU技術和專用芯片組技術相比,媒體處理器由于其獨特的數字視音頻輸入輸出接口、多媒體協處理器等,應用變得更加簡單。而且設備廠商可以根據市場變化隨時調整軟件應用,及時適應市場需求,不受專用芯片組本身技術局限性的限制。媒體處理器支持的嵌入式操作系統和軟件優化使得視頻會議系統更加高效、穩定和可靠。事實上,媒體處理器技術已經成為視頻會議的核心芯片技術,未來也將服務于3G可視電話等終端產品。
在視頻會議系統中,目前的媒體處理器主要有飛利浦的TriMedia系列和新PNX1500,ESS的LVP,ADI的ADSP2106X和Blackfin,TI的C6X和C8X以及DM642多媒體DSP芯片。這些媒體處理器的高速計算能力可以實現適用于不同協議的視頻會議通信終端。這些芯片可以輕松實現MPEG視音頻處理、H.263視頻處理,以及DVD、數字機頂盒、數字電視等其他多媒體應用。
2)寬帶網絡技術發展迅速的IP網絡,由于是非連通網絡,不適合實時多媒體信息的傳輸,但TCP/IP協議對多媒體數據的傳輸沒有根本性的限制。目前,全球各大標準化組織、行業聯盟和各大公司都在改進IP網絡上的傳輸協議,并取得了初步成果,如RTP/RTCP、RSVP、IPv6等協議。這為在IP網絡上開展視頻會議等多媒體業務奠定了良好的基礎。據預測,IP網絡上的視頻會議業務將大大超過電路交換網絡上的視頻會議業務。
隨著互聯網網絡規模和用戶數量的快速發展,如何進一步擴大在線服務的種類,提高網絡的服務質量是目前最受關注的問題。由于IP是一種無連接協議,在Internet網絡中沒有QoS的概念,無法保證足夠的吞吐量和傳輸延遲,只能盡力滿足用戶的需求。因此,如果不采用新的方法來改善目前的網絡環境,就無法大規模開發新的業務。
在現有的網絡技術中,從支持QoS的角度來看,ATM作為繼IP之后迅速發展起來的快速分組交換技術,具有獨特的技術優勢。因此,ATM曾被視為一種隨處適用的技術,人們最終會構建一個純粹的ATM網絡,通過網絡核心到達另一個桌面終端。然而實踐證明,這種想法是錯誤的。首先,純ATM網絡實現過于復雜,導致應用價格高,難以被大眾接受。其次,隨著網絡的發展,相應的業務發展沒有跟上,造成了目前ATM的發展。第三,盡管ATM交換機已被廣泛用作網絡的骨干節點,但ATM信元到桌面業務的發展非常緩慢。
由于IP技術和ATM技術在各自的發展領域都遇到了實際困難,都需要相互依賴才能進一步發展,所以這兩種技術的結合是必然的。多協議標簽交換(MPLS)技術是為了綜合利用網絡核心的交換技術和網絡邊緣的IP路由技術的優勢而產生的。其特點如下:
(1)基于單一轉發機制,可以同時支持同一網絡中多種業務類型的轉發;(2)通過短而固定的標簽,將傳統路由器的最長匹配路由方法替換為精確匹配路由方法;(3)通過集成鏈路層(ATM、幀中繼)和網絡層路由技術,解決了互聯網擴展和保證IP QoS傳輸的問題;(4)使用顯式路由功能,通過帶QoS參數的信令協議建立CR-LSP,可以有效實現全國范圍的流量工程。目前MPLS技術在QoS標簽分配信令、解決VC合并、傳輸分類業務等很多方面還存在很多困難,需要進一步完善。
3)分布式處理技術視頻會議實現點對點、點對多點、多點之間的實時同步交互通信。視頻會議系統要求不同媒體、不同位置的終端收發同步協調,多點控制單元(MCU)統一有效控制,使與會終端共享數據,有效協調各種媒體的同步傳輸,使系統在信息交換和處理上更加人性化。通信、合作與協調是分布式處理的要求,也是交互式多媒體協同工作系統(CSCW)的基本內涵。因此,從這個意義上說,視頻會議系統是CSCW的主要群件系統之一。
主流媒體處理器解決方案
隨著多媒體技術的廣泛應用,用DSP芯片設計多媒體設備已經成為人們關注的焦點。然而,對可編程媒體處理器的需求也很高。因為多媒體信號處理技術正在高速發展
例如一個早期的視頻會議設備采用H.261編碼視頻,在H.263出現后,最好是改用H.263標準,而且也許很快就會采用H.264 作為視頻會議的編碼標準。這就存在兩個要求,一是設備的更新換代,二是多種標準的轉換。對于用固定的專用芯片實現的設備,這兩條都難以達到。但如果采用 DSP作為核心處理器,只需更新軟件就可以達到第一個要求,增加部分功能軟件,可以適度滿足第二個要求。
正是考慮這種需要,一種新型的DSP芯片-媒體處理器(Media Processor)應運而生,并很快得到業界的廣泛關注。飛利浦、ADI、TI等半導體供應商都十分看好媒體處理器市場,并推出了具有競爭力的產品。高處理能力芯片的出現給視頻會議帶來更小的延遲和更高的幀頻。例如TI公司的TMS320 DM642、飛利浦的Trimedia和Equator的MAPCA,它們集成了豐富的多媒體信號接口,針對多媒體信號的特點優化了處理器結構,甚至內嵌了特殊協處理器用于進行專門操作,緩解通用處理器的壓力,例如視頻編碼中的變長編解碼(LC/VLD)。
媒體處理器提供了完全可編程的多媒體設備的實現工具。媒體處理器繼承了通用DSP芯片的特點,針對多媒體應用擴充了各種接口功能,優化了中央處理器結構。盡管媒體處理器出現的時間不長,但已得到廣泛關注,可以預見媒體處理器將會快速應用到多媒體設備制造業中。
中星微電子公司的多媒體芯片SoC平衡了集成度、靈活性、成本和功耗等多方面要求。目前其應用于 視頻會議系統 中的多媒體芯片產品有 VC0301P、VC0302和VC0321。該公司的副總裁俞青介紹說,中星微電子的多媒體芯片可以支持目前主流的各種音頻和視頻算法, 并支持從無線多媒體到高端視頻會議等一系列應用。在PC平臺上,中星微電子與微軟合作,最近推出基于USB2.0的視頻即時通訊系統,使視頻質量和系統穩定性上了一個新臺階。
針對視頻會議等多媒體應用,飛利浦推出數字媒體處理器PNX1500,這是一款系統級芯片(SoC)。據飛利浦半導體公司高級媒體處理組市場總監Jan Koene介紹,“最新產品Nexperia PNX1500在運行控制任務以及數字信號處理任務方面具有出色的能力,而這兩方面都是 視頻會議系統 所要求的。可以在單片PNX1500上運行這兩個任務,而在效率相同的情況下,這對競爭方案而言是難以實現的。通過在PNX1500上合并硬件模塊,例如視頻I/O、音頻I/O和通用接口,可以降低BOM 成本。因為所有的音視頻編解碼功能都是用軟件實現的,所以飛利浦的產品很容易適應新的標準,例如H.264。”
TI 的新型數字媒體處理器TMS320DM642帶有三個視頻口,均可輸入或輸出,支持BT656、百兆以太網口、多路音頻串口、66MHz PCI等等,可支持四路D1圖像,30幀/秒的MPEG-2的實時壓縮。TI 的數字媒體處理器不僅能夠以 Microsoft WMV9 格式提供高清晰視頻流,而且還能夠提供 MPEG-4、MPEG-2 以及 MPEG-1。此外,該器件還支持H.264。
TI公司半導體事業部高級業務代表鄭小龍表示,除了提供 720 MHz DM642 的樣片之外,目前 TI 還為 DM640 與 DM641 以及 600 MHz DM642 提供批量生產的器件。這些代碼兼容的數字媒體處理器可擴展各種時鐘速率及存儲器容量,能夠支持廣泛的應用,例如從基于視頻的便攜式消費類電子產品到視頻基礎設施設備等。
微軟公司 Windows Media 技術部副總裁 Amir Majidimehr 說:“對于 Windows Media 9 編碼器與解碼器而言,TI 的 DM642 是第一款成功通過 D1 清晰度條件下一致性測試的可編程 DSP。TI 的新型 720MHz DM642 有助于將 HD WM9 集成到各種具有代碼兼容與可編程性能的嵌入式消費類應用中。”
ADI的Blackfin是一種高性能、雙乘加器(MAC) DSP,具有微處理器性能,諸如監督和用戶模式、存儲保護、8-/16-/32位算術及多媒體處理擴展。Blackfin處理器既能作為主要的音視頻處理器,又能用作圖形用戶界面(GUI)和網絡處理的主處理器。Blackfin是完全可編程的。因此可以很容易地支持新標準,而無需改變硬件平臺。例如 ADI可視電話平臺中的Blackfin處理器能夠支持H.264,這是通過軟件升級來實現的。
據ADI公司軟件和系統技術部產品行銷經理Dan Ivanciw介紹,Blackfin處理器架構經過優化,能很好地執行控制和數字算法,可以作為主處理器和音視頻處理器。“設計人員無須采用多個不同的處理器、不同的開發環境及不同的工具包,無論是正在開發典型主功能代碼還是高級音視頻編解碼,采用Blackfin,開發團隊只需要掌握一種編程方法、指令系統、開發工具環境。用戶也會得到益處:縮短產品面市時間,削減開發成本,降低開發風險,提高IP復用性。”
在多媒體信號處理領域,特別是在視頻處理方面,通常要求數字信號處理器具有針對多媒體應用的、優化的內核結構和豐富的媒體接口,而通用信號處理器在這方面性能得不到充分發揮。鑒于此,美國Equator公司推出了BSP系列高速寬帶數字信號處理器。BSP-15是該系列中的一款,可與 MAP-CA反向兼容。
BSP-15是專門以視頻應用為中心而設計的高效DSP,以高度集成的單芯片滿足了寬帶產品的需要。在400MHz的時鐘頻率下, BSP-15處理能力為40 GOPS(每秒400億次整數運算),處理速度相當于奔騰III的8.5倍,是同系列MAP-CA芯片的1.33倍,是其它解決方案的10倍以上。BSP -15的核心功能是采用軟件專為高性能、大視頻流的寬帶應用而設計,結合iMMediaTools軟件開發環境及其提供的視音頻庫,BSP-15可以為數字視頻圖像應用提供高效的解決方案。
據某視頻會議產品研發工程師介紹,選用BSP-15芯片進行視音頻的系統設計具有3方面優勢:其一,BSP-15 是專為視頻圖像處理而設計的,能夠提供高質量的視頻效果;其二,BSP-15具有豐富的片上I/O接口,不必添加過多的外圍設備,因而可以降低整個系統的成本和設計的復雜度;其三,完全采用C語言編程,沒有匯編語言要求,升級方便,靈活性高。與同系列的TI DSP及Philip的Trimedia 系列DSP相比,BSP-15不足之處是軟件開發難度較大,穩定性也被懷疑。但由于其出色的處理性能,BSP-15處理器在消費電子產品、視頻會議、數字圖像處理等方面仍將占有較大的市場。
以色列VCON通信有限公司去年推出基于新一代Equator BSP-15多媒體處理器的高性能的視頻會議編解碼器-HD100視頻會議引擎。VCON公司首席市場官Gordon Daugherty認為:“視頻會議的質量越來越接近廣播電視的質量,視頻會議市場已經進入了一個新的階段。VCON集成商可以利用HD100視頻會議引擎小巧的體積、極高的音頻視頻質量,以極具競爭力的成本構建各種先進多媒體會議應用。”
未來視頻會議的技術趨勢
隨著時延問題被IETF技術和標準(如組播技術、帶寬預留協議和實時控制協議)逐步解決,基于IP的視頻會議方案把終端互操作性和高傳輸性能結合了起來。就標準而言,資源預留協議(RSVP)有助于避免網絡擁塞,保證了視頻會議的傳輸質量;實時傳送協議(RTP)雖然不能保證數據傳輸的完整性,但能利用時間戳方法處理好定時關系,使傳輸過程中的數據順序不被打亂。視頻通信將會變得更容易,費用會更低,傳統的會議模式已經遠遠不能適應網絡時代的需求。而 視頻會議系統 作為支持人們遠距離進行實時信息交流、開展協同工作的應用系統,使協作成員可以遠距離進行直觀、真實的視/音頻交流。
ADI公司軟件和系統技術部產品行銷經理Dan Ivanciw認為,視頻會議的技術趨勢之一是需要更高壓縮率的視頻編解碼技術;還有在服務質量和安全方面有所改進的網絡;今天功能固定的、不靈活的視頻會議產品需要加以替換,或者采取昂貴的硬件升級去兼容,或者在將來利用這些變化和改良。另一趨勢是基于IP的視頻服務與VoIP產品融合。第三種普遍趨勢是:服務供應商給更廣泛的住戶和商業客戶提供IP視頻增值服務。這種情況也存在于大多數產品領域,用戶總是希望增加更多功能,例如三方或多方音視頻會議。附加的功能需要終端設備具有更強大的處理能力,但是通過把一些性能融進終端設備中可以減少基礎架構方面的需求。
飛利浦半導體公司的Jan Koene也認為,視頻會議的主要趨勢是更先進的編解碼技術,例如符合H.264標準;另一個趨勢是基于POTS(PSTN)的 視頻會議系統 將會轉變到基于IP的系統;第三個趨勢是分辨率將從現有的CIF級增加到SD級,甚至HD級。
中星微電子的俞青則表示,除了需要適合視頻會議終端的高質量/低碼率的視頻壓縮技術以外,視頻會議應用層的抗誤碼技術和視頻會議服務器端的QoS控制技術也是視頻會議重要的技術發展趨勢。
中興通訊視訊系統部工程師王亮將視頻會議的發展趨勢總結為“四化”建設:
1.系統功能多元化具有圖文同傳功能:除視音頻外,可以方便地傳送和顯示電腦文檔用于培訓、匯報、交流;視頻會議與電話系統渾然一體:可方便接入會議電話系統,通過電話、手機也可加入會議;視頻會議和辦公自動化(OA)系統有機結合,實現以下功能:OA網上進行會議組織、會議郵件通知、會議控制、系統維護和升級;OA網上實現個人可視通話及多方會議;OA網上只用普通PC即可在任何時間學習會議或培訓內容;集中指揮、遠程調度-電視墻顯示統覽全局,接入電話遠程指揮。
2.系統組網多樣化
有網絡就能開會,通過專線、ISDN、IP(ADSL、LAN接入)、電話等現有網絡接入各種多媒體終端。
3.圖像清晰化
視頻會議需要更優異、更清晰、更成熟的圖像編解碼技術。
4.使用、維護簡捷化
易于使用,可自行組織、控制會議;進行遠程管理、遠程維護、升級,降低維護成本;更新設計,大幅提高系統穩定性。
華為公司多媒體產品線營銷工程部部長陳崇軍指出,視頻會議未來的發展首先需要更為先進的音視頻編解碼技術和更專業的圖像及語音前后端處理技術;其次還要能與下一代網絡相融合,例如支持IPv6等;第三需要集成度更高、處理能力更強的終端技術。他進一步說明,視頻編解碼技術會向H.264發展,語音技術向高保真、低帶寬發展;MCU向交換機和路由器融合;隨著網絡寬帶化,視頻會議終端也將智能化,其發展方向是小型化、全信息化家庭網絡中心寬帶智能終端,將通訊、娛樂、信息等各種功能融合在一起。
網絡技術標準推動視頻會議發展
網絡技術標準的制定為多媒體應用奠定了基礎。H.323協議是IP網絡多媒體通信標準,解決各廠商設備的互通互控問題。H.264的出臺,使得視頻會議能以更低的成本提供更高質量的視頻效果,以前由于資金和技術問題無法實現的視頻應用也有望成為現實。就像網絡日志(Weblogs)、即時消息等在過去幾年成為重要的網絡應用一樣,H.264技術將有力地推動新的視頻應用不斷誕生。
采用H.264技術的MPEG-4在低碼率視頻傳輸上取得了突破性的進展。據悉,Tandberg和Polycom已經生產出支持H.264的產品,華為將在今年底公布H.264的產品,鼎視通在遠航系列產品中也宣布支持該標準。
2003年7月,ITU批準了H.239標準,基于此項技術,視頻用戶可以得到雙流視頻服務。據Polycom公司技術總監余寶生介紹, Polycom的人物+內容(People+Content)雙流技術允許主機在一個視頻會議中同時發送視頻和內容(PowerPoint、瀏覽器屏幕內容等)。另外,該標準所提供的方案同時適用于基于信令的H.320和H.245系統,可以實現在會議系統中同時傳送和顯示多路視頻信息。 RADVISION、Sony和VCON等公司也都宣布支持H.239,并生產相關產品。Tandberg的Duo Video也可以實現該功能。
隨著各種技術的不斷發展和一系列國際標準的出臺,視頻會議技術及其設備由少數大公司一統天下的局面被打破了,逐漸發展成為由外商(如: Polycom、Tandberg、VTEL、VCON等)和中國本土企業(如:中興、華為、中太、瑞福特等)共同分爭視頻會議市場的格局。高速IP網絡及互聯網的迅猛發展,使視頻會議的應用與發展進入了一個新的時期。視訊技術在未來的幾年內將會越來越廣泛地被應用到各個領域,成為信息社會的主流應用之一。