ページの先頭です

符号化・ストリーミングコンサルティング 概要

  • 概要
  • 業務実績

動画や音声を圧縮する符号化技術や、圧縮されたデータをネットワークの特性に応じて伝送するストリーミング技術の分野で、お客さまの研究開発や事業化などにかかわる課題をコンサルティングベースで解決します。

サービスメニュー

符号化・ストリーミング分野において、お客さまの事業フェーズ(研究、開発、事業化)にあわせたさまざまなサービスを提供します。

符号化・ストリーミングにかかわる研究・開発・事業化支援イメージ

符号化・ストリーミングにかかわる研究・開発・事業化支援イメージ

技術分野

符号化

符号化とは、静止画、動画像、音声などのデジタルデータを圧縮する技術であり、放送、携帯電話、インターネットを利用した映像や音楽のダウンロードサービス、IP電話、蓄積メディア(例えば、DVD、Blu-ray等の光ディスクやハードディスク)など、私たちの生活に欠かせない製品やサービスに用いられている重要な技術です。

動画像符号化技術の身近な利用例としては、国際標準規格のMPEG-2が採用されたデジタル放送やDVD、また、同じく国際標準規格であるH.264/MPEG-4 AVC(以下、H.264)が採用されたワンセグメント放送や地上デジタル放送のIP再送信などがあります(下表参照)。
動画像符号化の基本的な原理は、(1)イントラ予測(画面内の相関関係を利用して圧縮する方法)、(2)インター予測(画面間の相関関係を利用して圧縮する方法)、(3)エントロピー符号化(シンボルの出現頻度によって割り当てる符号のビット数を変化させる圧縮の方法)の3つです。前述のMPEG-2やH.264では、イントラ予測、インター予測、エントロピー符号化等を組み合わせたハイブリッド符号化によって高い圧縮率が実現されています。

国際標準規格 MPEG-1 MPEG-2(MP@ML) MPEG-4
(Simple Profile)
H.264/MPEG-4 AVC
(High Profile)
用途例 ビデオCD デジタル放送、DVD 移動体通信ストリーミング ワンセグメント放送、
一部のCSデジタル放送、
地上デジタル放送のIP再送信
ビットレート 1~1.5Mbps 4~15Mbps 10kbps~40Mbps 10kbps~240Mbps
圧縮率 1/25 1/12~1/50 1/20~1/200 1/20~1/100
変換 8×8 DCT 8×8 DCT 8×8 DCT 整数精度 4×4 DCT
整数精度 8×8 DCT
イントラ予測 DC係数予測 DC係数予測 適応AC/DC予測 4×4ブロック9通り
8×8ブロック9通り
16×16ブロック4通り
ピクチャ構造 I/Pピクチャ I/P/Bピクチャ I/Pピクチャ I/P/Bピクチャ
複数参照フレーム
動き補償ブロックサイズ 16×16ブロック 16×16ブロック 16×16、8×8ブロック 16×16、16×8、8×16、8×8、8×4、4×8、4×4ブロック
動きベクトル精度 1画素精度 1/2画素精度 1/2画素精度 1/4画素精度
ループフィルタ なし なし なし デブロッキングフィルタ
エントロピー符号化 2次元VLC 2次元VLC 3次元VLC CAVLC
CABAC
インターレース対応 なし フレーム/フィールド適応動きベクトル補償、フレーム/フィールド適応DCT、 Dual Prime予測 なし マクロブロックフレーム/フィールド適応符号化、ピクチャフレーム/フィールド適応符号化

動画像符号化方式(国際標準規格)の比較(みずほ情報総研調べ)

  • *DCT(Discrete Cosine Transform、離散コサイン変換)
  • *DC(Direct Current、変換係数の直流成分)
  • *AC(Alternating Current、変換係数の交流成分)
  • *VLC(Variable Length Coding、可変長符号化)
  • *CAVLC(Context-based Adaptive Variable Length Coding、コンテキスト適応型可変長符号化)
  • *CABAC(Context-based Adaptive Binary Arithmetic Coding、コンテキスト適応型2値算術符号化)

音声符号化技術の利用例としては、国際標準規格であるG.711、G.723、G.726、G.729などが採用されたIP電話、また、同じく国際標準規格であるAAC(Advanced Audio Coding、先進的音響符号化)が採用されたデジタル放送やDVDなどがよく知られています(下表参照)。
音声符号化の原理は音響の圧縮と声(スピーチ)の圧縮で大きく異なります。人間の聴覚の特性に基づいて、識別できない情報を削減する点は同じですが、声の圧縮では、さらに人間の声帯の仕組みを利用することによって、音響の圧縮方式よりも低いビットレートを実現できるように工夫されています。

国際標準規格 G.711 G.723、G.726 G.729 MP3(MPEG-1 layer3) AAC(MPEG-2、MPEG-4)
用途例 IP電話 IP電話 IP電話 携帯型音楽プレーヤー デジタル放送、DVD、携帯型音楽プレーヤー
対象周波数 8kHz 8kHz 8kHz 32、44.1、48kHz 8~96kHz
主ビットレート 64kbps 16、24、32、40kbps 8kbps 32~192kbps 32~288kbps
遅延時間 0.125msec 0.125msec 25msec 約50msec 約50msec
圧縮技術 PCM(μ-law、a-law) ADPCM CS-ACELP サブバンド符号化、MDCT、ハフマン符号化、聴覚心理 サブバンド符号化、MDCT、ハフマン符号化、聴覚心理、TNS

音声符号化方式(国際標準規格)の比較(みずほ情報総研調べ)

  • *PCM(Pulse Code Modulation、パルス変調符号化)
  • *ADPCM(Adaptive Differential Pulse Code Modulation、適応型差分PCM )
  • *CS-ACELP(Conjugate Structure and Algebraic Code Excited Linear Prediction、共役構造代数符号励振線形予測)
  • *MDCT(Modified Discrete Cosine Transform、変形離散コサイン変換)
  • *TNS(Temporal Noise Shaping、時間領域雑音整形)

当社は動画像符号化や音声符号化の技術分野において、お客さまの研究、開発および事業化を支援するためのさまざまなサービスメニューを持っています。
研究フェーズやプロトタイプシステムなど比較的小規模なソフトウェアの開発フェーズにあるお客さまに対しては、符号化アルゴリズムの考案、アルゴリズムの性能評価、アルゴリズムを実装したソフトウェアの開発などで、お客さまの研究開発のスピードアップに貢献します。特に、画像データの処理では避けて通れない高速化の課題に対しては、MMXやSSE等のアセンブラ言語を用いた実装で対応することが可能です。

また、より規模の大きなシステム開発や事業化のフェーズにあるお客さまに対しては、事業性評価、採用技術の選定などのコンサルティングサービスから、システムの設計・開発・運用までをフルサポートすることができます。

キーワード MPEG-1、 MPEG-2、 MPEG-4、 H.264(MPEG-4 AVC)、 G.723、 G.729、 多重化(MUX、 DMUX)、 トランスコーディング、 高速化(MMX、 SSE、 SSE2等)

ストリーミング

符号化された動画像や音声のデータをネットワークで流通させるために、ストリーミング技術は欠くことのできない重要な技術です。特に、IP電話やIPTVなどリアルタイム性が重要視されるIPネットワーク上のサービスにおいては、ストリーミングにおけるさまざまな技術を駆使する必要があります。

インターネットや社内LAN (Local Area Network)などのIPネットワーク上でデータを通信する際には、データをIPパケットに格納します。このIPパケットを送受信するための代表的なプロトコルとして、TCP (Transmission Control Protocol)とUDP (User Datagram Protocol)の2つがあります。TCPには受信側へのパケットの到着を保証する機能があるため、データの欠損が許されないようなサービスでの利用に適しています。その反面、リアルタイム性が求められるようなサービスには向いていません。一方、UDPは受信側へのパケットの到着を保証しないという欠点はあるものの、テレビ電話や放送などリアルタイム性が求められるサービスには向いています。

UDPを採用した場合には、パケットロスやパケットの入れ替わりが発生した場合の対応を上位のアプリケーションで行わなければなりません。例えば、エラー耐性と呼ばれる技術では、パケットロスが発生した場合でも、受信側で、ある程度データを復元できるように、重要な情報を複数のパケットに分散するなどして送ります。エラー耐性技術の一つであるエラー訂正技術では、パケットロスが発生した際でも受信側でデータを復元できるように、送信する情報に冗長性を持たせます。FEC(Forward Error Correction、前方誤り訂正)はエラー訂正技術の代表的な例です。また、欠損した画像や音声のデータを他のデータで補完するエラーコンシールメントと呼ばれる技術もあります。さらに、パケットロスをなるべく発生させないようにするための技術もあります。輻輳制御は、ネットワークの混み具合(輻輳の度合い)を監視しながら、伝送レートを調節する技術です。輻輳制御を行うことによって、ネットワークが込み合っているときには低い伝送レートで送信し、ネットワークが空いてきたら高い伝送レートで送信することが可能になります。

当社は、上述したようなストリーミングに関する技術を多数保有しており、お客さまの課題を解決するためのさまざまな方策を提案することができます。特に、符号化とストリーミングを組み合わせて、研究、開発、事業化を検討されているお客さまには、最適なソリューションを提供することができます。

キーワード TCP/IP、 UDP/IP、 RTP、 RTCP、 H.323、 マルチキャスト、 エラー訂正、 エラー耐性、 輻輳制御、 NGN(次世代ネットワーク)

お問い合わせ

担当:情報通信研究部
電話:03-5281-5289

関連情報

おすすめソリューション

視聴者にカスタマイズされた次世代の放送サービスや3次元自然画像、自由視点映像など、高度情報提示制御技術の分野で、お客さまの研究開発や事業化などにかかわる課題をコンサルティングベースで解決します。

デジタル資産のアーカイブ・管理に関わる技術開発やシステム構築を、蓄積された知見・技術力とコンサルティングベースの課題解決アプローチにより支援します。

蓄積された技術・ノウハウとコンサルティングベースの課題解決アプローチによりお客さまの計算処理に関わる高速化ニーズにお応えします。

情報通信研究部
03-5281-5289

メールマガジンお申し込み

みずほ情報総研メールマガジン、「ケミマガ」化学物質管理関連サイト新着情報メールマガジンを無料配信

RSS配信コンテンツ

ニュースリリース、ソリューション、コラムなどの最新情報をRSSで配信

みずほフィナンシャルグループ

  • みずほフィナンシャルグループ
  • みずほ銀行
  • みずほコーポレート銀行
  • みずほ信託銀行
  • みずほ証券
  • みずほインベスターズ証券
  • みずほインベスターズ証券

グループ会社

ブランドコンセプト

ページの先頭へ
ページの先頭へ