|
| ビジョン アーキテクチャ(Vision Architecture) |
実世界を捉え, リアルタイムに応答する高速ビジョン技術並びにその応用システムを応用開拓から,
システム実現のための諸課題を設定・解決する学術分野. 様々な分野において新しい応用を切り拓くためには,
限界性能に近い動作を可能とするシステム技術の創出が求められる. そのためには,
応用・原理・デバイスの3者間の洗練された関係性を築くことで突出した性能と機能を追求することが肝要である.
ビジョンアーキテクチャは, この設計思想に基づき, 人間の眼を遥かに凌ぐ超高速の画像センシングを軸として,
様々な分野において新しい応用を切り拓く実践的な研究を目指すものである. 具体的には, VLSI技術,
並列処理, 画像認識, 計測工学を駆使して, 超高速の認識・センシングシステムを創出し, ロボティクス,
検査, 映像メディア, ヒューマンインタフェース, デジタルアーカイブ等の分野で新しい応用を具現化している. |
| 関連用語: |
高速画像処理, 並列画像処理,
感覚運動統合, ダイナミクス整合,
ビジュアル フィードバック,
アクティブ センシング,
インテンショナル センシング,
アクティブ ビジョン, 3次元計測,
流体・粒子計測, 書籍電子化,
ジェスチャー認識
| |
|
| ビジョン チップ(Vision Chip) |
イメージセンサの各画素に光検出器 (PD: Photo Detector) とともに,
プログラマブルな汎用ディジタル処理要素 (PE: Processing Element) を一体的に集積し,
汎用かつ高速な画像処理をチップ内で実現するデバイス. 走査のない完全並列の構造を持ち, 従来のように,
イメージングデバイスと画像処理機構との間に存在するデータ転送のボトルネックが存在しないため,
小型, 軽量, 低消費電力であるだけでなく, 高い実時間性をもった高速画像処理を実現することができる.
処理アーキテクチャは, 画像処理に効果的なSIMD (Single Instruction stream,
Multiple Data stream) 型の並列処理アーキテクチャを用いる場合が多く, 簡易型のA/D変換器も内包する.
汎用演算機構だけでなく, ターゲットトラッキング専用のデバイスも開発されている. |
| 関連用語: |
高速画像処理, ダイナミクス整合,
SIMD アーキテクチャ,
ビット シリアル アーキテクチャ,
リコンフィギュラブル アーキテクチャ,
CMOS イメージャ, フレームレート,
走査
| |
|
| 高速画像処理(High Speed Image Processing) |
ダイナミックな変動現象の把握や,
ビジュアルサーボに基づくロボット制御において要求されるサンプリングレートと遅延を充足するように設計された画像処理.
特に, 通常の画像処理で用いられるビデオレート (NTSCの場合で約30fps) 以下の画像に対して, それを上回る,
1秒あたり100~1,000枚の画像に対して, 同じ処理速度で実行されるものを指す.
対象の帯域をカバーできていない従来の画像処理が,
不完全な情報に対する予測や学習が必須であったのに対して, 必要な帯域をカバーするフレームレートでの処理を前提とするため,
処理アルゴリズムが簡素化し, 良好なレスポンスを実現することが可能となる. 一般に, 高速ビデオは,
撮像と録画の高速化を実現する技術であるのに対して, 高速画像処理は撮像と画像処理を高速化するものであって,
例えばリアルタイムビジュアルフィードバックを実現するためには, 高速ビデオではなく,
高フレームレートかつ低レイテンシーの高速画像処理が必須である. |
| 関連用語: |
フレームレート, 並列画像処理,
ビジョン チップ, ビジュアル フィードバック
| |
|
| 並列画像処理(Parallel Image Processing) |
画像のデータ構造と処理の特性を利用して,
並列化による高速化を図った画像処理及びそれを実行する専用の処理アーキテクチャに関する技術.
デバイスレベルでは, 走査という逐次処理を排除すると同時に,
特徴量演算のための画素単位での処理の並列化や1,000個のターゲットを同時観測するための対象単位での並列化等がある.
並列画像処理では, データレベルでの並列性を利用したSIMD (Single Data stream,
Multiple Data stream) 型の処理の導入やコンパクトな処理エレメント (PE: Processing Element) の実現のための
ビットシリアルアーキテクチャの導入や多機能化のための
リコンフィギュラブルアーキテクチャの導入などが図られている.
これらを用いることにより, n×n画素の画像に対して, 1のオーダーの処理時間を実現することが鍵となる. |
| 関連用語: |
ビジョン チップ, 高速画像処理,
走査, 列並列,
ビット シリアル アーキテクチャ,
リコンフィギュラブル アーキテクチャ,
SIMD アーキテクチャ
| |
|
| 走査(Scanning) |
何らかの形で配列されているデータに対する取得・転送・表示等において,
並列操作ではなく, 要素ごとに逐次的に操作する方法である.
少数の処理・伝送回路で大規模データを処理できるという利点があるが, 速度の点では不利となる.
通常の画像は, 2次元データであり, 行 (row) 方向と列 (column) 方向に順次走査されて, 画像データとなる.
グローバルシャッター機能がある場合は, データの同時性が補償されるが,
その機能がない場合のデータの取得時間は走査のタイミングに依存し, 左上のデータと右下のデータは,
画像全体の操作時間 (=フレームレートの逆数) となる. また,
左上のデータは1フレーム前の右下のデータの直後となり, 時間を考慮した画像処理では注意が必要である.
例えば, 走査方向と同方向に移動する物体と逆方向に移動する物体では, 映像がかわることになる. |
| 関連用語: |
CMOS イメージャ, 列並列
グローバル シャッター, 空間分解能,
フレームレート
| |
|
| 列並列(Column Parallel) |
2次元のデータ配置 (横方向を行,
縦方向を列と呼ぶ) を持つ画像データに対して,
一つの列に処理要素 (PE: Processing Element) を接続・割り当てた並列処理構造.
画素に対してPEを1対1に接続する完全並列型と画像全体を走査して一つの演算器で処理するCPU型の中間的な構造と言える.
行方向に走査するため, 完全並列よりは処理速度が遅くなるが, msオーダーの処理が実現可能である. また,
列の数だけ伝送線を出さず, 部分的に走査して伝送線やA/D変換の数を抑えるタイプもある. 本研究室が開発し,
浜松ホトニクスが実用化した
インテリジェントビジョンシステムは, この構造を有している. |
| 関連用語: |
走査, SIMD アーキテクチャ
| |
|
| ビット シリアル アーキテクチャ(Bit Serial Architecture) |
汎用プロセッサの処理アーキテクチャの一つで,
1bit分のALU (Arithmetic and Logic Unit) をn回逐次的に用いることにより,
nbitの演算を実現するアーキテクチャ. このアーキテクチャは,
少ない数の真空管を用いていた黎明期の電子計算機で用いられたもので,
最近のプロセッサでは32bitあるいは64bit分のALUを並列に用いるビットパラレルアーキテクチャ (Bit Parallel Architecture) が使われている.
nbitに対して処理時間はn倍となるが, 処理回路が1bit分で済むため,
1画素に使えるトランジスタに限界があるビジョンチップや完全並列タイプの画像処理で導入されている.
この際, 高速画像処理では1ms程度の処理が求められており, 処理速度には余裕があるため,
このアーキテクチャの特徴が活かされている. |
| 関連用語: |
ビジョンチップ, SIMD アーキテクチャ,
並列画像処理
| |
|
| リコンフィギュラブルアーキテクチャ(Reconfigurable Architecture) |
処理速度を向上させる上で, 処理を担うプロセッサ回路は, アルゴリズムに応じてその最適な構成が異なると考えられる.
個別のアルゴリズムに対して, 専用化された回路構成をタスクごとに再構成可能なアーキテクチャをリコンフィギュラブルアーキテクチャと呼ふ.
このアーキテクチャは, 専用化による高い性能の実現と柔軟性を両立する技術として注目されている.
本研究室の並列高速画像処理アーキテクチャの一部は, このアーキテクチャを実装しており, 様々な機能を同じハードウェアで実現している.
|
| 関連用語: |
ビジョン アーキテクチャ,
ビジョン チップ, 高速画像処理, 並列画像処理,
列並列, ビット シリアル アーキテクチャ,
SIMD アーキテクチャ |
|
|
| SIMD アーキテクチャ(SIMD Architecture) |
並列の演算処理回路に対して, 並列のデータパスを有し,
単一のインストラクションで制御する並列処理アーキテクチャで,
SIMDは, Single Instruction stream and Multiple Data streamの略.
通常は同一の処理回路 (PE:Processing Element) を並列に配置し,
それぞれの処理回路には独自のデータパス (画像の場合はピクセルのデータ)を有し,
並列処理回路全体で単一のインストラクションで制御するアーキテクチャである.画像の場合は,
もともと処理の均質性が高いので, このアーキテクチャに向いているが, 画素ごとの条件分岐をはじめとするMIMD
(Multiple Instruction stream and Multiple Data stream) 構造の擬似的な実現やグローバル特徴量の並列回路での抽出等にノウハウがある.
また, ハードウェア実現の観点からは, 同じPEを並べる構造となるため,
実際に設計するPEの規模は小さく, ワンチップ化やFPGAでの実装では, 全体の回路規模に比して設計の負荷は小さい. |
| 関連用語: |
ビジョン チップ, 高速画像処理,
並列画像処理, グローバル シャッター
| |
|
| CMOS イメージャ(CMOS Imager) |
画素ごとにフォトディテクタ (Photo Detector) の出力をCMOSスイッチで順次走査しながら画像を構成するタイプのイメージャ.
CCDイメージャでは画素ごとのフォトディテクタの出力を一度並列にCCD (Cahrge
Coupled Device) にチャージした上で順次転送するため,
画素データの同時性が補償されるが,
CMOSイメージャの場合は原理的にこのようなグローバルシャッター機能がなく,
画素データの同時性が補償されていない. 近年, 回路の改良によりグローバルシャッター付きのCMOSイメージャが開発され,
今後増加するものと期待されている. また, 発展形として, スイッチ機能以外に,
主として感度向上等の撮像性能の向上のための回路を数個から20個程度のトランジスタで実現した画素構造が開発され,
アクティブピクセル (Active Pixel) と呼ばれている. さらに,
画像処理等の機能を数十から数百トランジスタで実現した画素構造は,
スマートピクセル (Smart Pixel) と呼ばれる.
本研究室で開発したビジョンチップはスマートピクセルの一種で,
汎用PE (Processing Elemnt) を画素ごとに実現している. |
| 関連用語: |
イメージャの感度, 空間分解能, 走査,
グローバル シャッター, フレームレート
| |
|
| フレームレート(Frame Rate) |
動画像に対して,
1秒あたりに表示する画面の数のことを指し, fps (flame per second)という単位を用いる.
旧来のNTSC規格 (インターレース) では, 白黒で30fps, カラーで29.97fps, ヨーロッパのPAL規格では25fps,
劇場用のフィルムでは24fpsを用いたという歴史的な経緯から, 現在のハイビジョン規格では, 60fps, 30fps,
59.94fps, 29.97fps, 50fps, 25fps, 24fps, 23.98fps等が解像度とスキャン方式に応じて混在する. 走査方式には,
プログレッシブ走査 (順次走査) とインターレース方式 (飛び越し走査) とがあり,
前者は走査線を上から順に走査するが, 後者は通常, 走査線1本おきの走査 (2:1と表記する) を走査線をずらして2回行って,
全体を走査する方法である. |
| 関連用語: |
走査, CMOS イメージャ,
グローバル シャッター, イメージャの感度
| |
|
| 空間分解能(Spatial Resolution) |
一般に, イメージャの空間分解能は, 画素数で定義され,
例えば, 1,024×1,024画素(≒100万画素)や1,920×1,080画素(≒200万画素, HD規格)等をはじめとして,
現在では1億画素を越えるものが開発されている. ただし, 一般には画素データは走査によって読み出されるため,
高分解能になるにつれて, 転送時間や 転送回路の速度が増加することとなり,
これらに対する対策が必要であり, 限界も存在する. すなわち, 時間分解能と空間分解能は, ある意味でトレードオフが存在し,
この両者のどちらを優先するかや両者の統合といった課題が存在する. |
| 関連用語: |
ビジョン アーキテクチャ,
ビジョン チップ, CMOS イメージャ,
フレームレート, イメージャの感度,
グローバル シャッター, 走査 |
|
|
| イメージャの感度(Sensitivity of Imager) |
イメージャあるいはデジタルカメラ (ビデオカメラも含む) の感度の表示は様々なものが使われている.
そもそも計測における感度とは,
入力に相当する物理量に対する出力に相当する物理量 (多くは出力電圧) の比のことを意味するが,
日常的に「感度がいい」という場合は,
意味のある出力が得られる入力物理量の最小値 (計測では感度限界と呼ばれる) を意味している場合もある. そのため,
計測用の機器とデジカメ等の消費財では違う表現が用いられている. 前者の意味では,
イメージャのデバイスとしての感度としては,
イメージャの表面照度 (カメラでは像面照度) の時間積分値に対する出力電圧として定義され, 単位はV/lx·sであるが,
正確にはフォトディテクタの分光感度特性があるので光源依存となる. カメラの場合は,
像面照度に変えて被写体照度に対する出力特性として考えることになるが,
カメラとしての出力を考えると, 出力電圧よりも得られる画像に意味があるため,
標準光源下での最低被写体照度 (感度限界) がよく用いられる. この場合,
光源やレンズ系に依存するため, 「最低被写体照度 0.06 lx /F1.4」等のように,
レンズ系の特性や光源の特性を付記して表現する. また, デジタルカメラ等の場合には,
一般のユーザーの便宜のため, 従来のフィルムの感度との対応を表現する「ISO感度相当」や,
定義された被写体輝度が定義された基準値になる感度である標準出力感度等が用いられる. |
| 関連用語: |
CMOS イメージャ, 空間分解能,
フレームレート
| |
|
| グローバル シャッター(Global Shutter) |
イメージャの各画素データを同時に取得することが可能な電子的シャッター機能.
イメージャの回路の動作原理から, CCD (Charge Coupled Device) 型のイメージャではこの機能が実現されているが,
通常のCMOS イメージャではこの機能がない.
近年, この機能がついたCMOSイメージャも開発されている. グローバルシャッター機能を使って撮像された画像データは,
各画素の同時性が補償されているため, 対象の運動の方向と走査の方向との干渉が生じない. ちなみに,
旧来の機械的シャッターも, その構造から撮像時刻の同時性は補償されていない. |
| 関連用語: |
CMOS イメージャ, 走査
| |
|
| 構造照明法(Structured Light) |
能動的なパターン照明を用いた3次元計測方法.
カメラと空間的あるいは時間的にパターン同定が容易な既知のパターン照明を投影するプロジェクタから構成され,
対象の表面上で反射した照明パターンと画像の対応から3次元位置抽出手法 (例えば, 三角測量の原理等) を用いて,
対応点での3次元位置の抽出を行い, それを画像面内を処理することにより, 3次元形状情報を得る方法である.
用いるパターン照明には様々な方法が提案されており, 対応点抽出が容易な場合には, 格子あるいは格子点パターンが用いられ,
対応点抽出が複雑な場合には, 対応点抽出のためにランダムドットや2次元M系列パターン,
さらには色情報で変調をかけたもの等が用いられている.
また, 扇状レーザーパターンの走査による光切断法は, 速度は遅いが精度が必要な用途ではよく用いられている.
対象表面が鏡面の場合には, 鏡面を考慮した対応点の同定が必要である. |
| 関連用語: |
三次元計測, 多点計測, 書籍電子化
| |
|
| 多点計測(Multi Target Measurement) |
画像内を多数の領域に分割し,
各分割領域の局所変化を同時に解析し, 計測量を推定する技術. 特に, 対象が多数の微少対象である場合には,
各対象に対する局所処理を画像全体で並列実行することにより, 全体として高速の多点計測が実現可能となる.
具体的な例としては, 粒子あるいは小型の製品の検査, 多数の細胞等に対するバイオイメージング, 血球・血流解析,
流体計測, 微生物の観測, マイクロ・微小物体のマニピュレーション, 基板などの表面洗浄のための塵検出, 大気中の粒子観測,
テクスチャを用いた運動計測, 構造照明による3次元計測, イメージセンサによる可視光通信等がある. 1秒間に1,000フレームの速度で,
1,000個以上の対象の状態を同時に計測するための専用プロセッサが開発されている. |
| 関連用語: |
並列画像処理, 特徴量抽出,
モーメント抽出,
流体・粒子計測
| |
|
| 3次元計測(Three Dimensional Measurement) |
計測対象の3次元の表面形状を取得する計測技術. 形状計測, 形状測定,
3次元センシングなどとも呼ばれる. 一般に,
機械的プローブを対象物表面に接触させアームの運動学から3次元位置を計測する接触式と光計測を主体とする非接触式がある.
1点ずつ計測してスキャンする方法と, 画像により端点を同時に計測する方法がある. 画像ベースの非接触型の方法では,
多点の3次元計測技術が必要となり, 本研究室ではその高速化に取り組んでいる. その結果,
従来は静止した物体の観測が主流であったのに対して, 運動・変形する物体に対しても,
1kHzの速度でリアルタイムに形状を取得するシステムを開発した. このような超高速のリアルタイム3次元センシングシステムは,
ロボティクス, 工業製品検査, 自動車, ヒューマンインターフェース等の分野で活用が期待されている. |
| 関連用語: |
高速画像処理, 並列画像処理,
構造照明法, フレームレート,
空間分解能
| |
|
| テンプレート マッチング(Template Matching) |
テンプレートマッチングは, 入力画像から対象を検出するための画像処理の手法の一種である.
予め保持されている対象のパターンを入力画像上で走査するもので, 各走査位置でマッチング演算を行い,
得られる類似度に応じて, 対象の認識が行われれる. マッチング時に利用される類似度には,
SSD (Sum of Squared Difference:2乗誤差の総和), SAD (Sum of Absolute Difference:絶対値誤差の総和),
NCC (Normalized Cross-Correlation:正規化相互相関)等の方法が提案されている. ターゲットトラッキングの場合は,
前フレームのターゲット位置に対して移動可能性のある範囲を探索範囲とすることから, 高速画像の利用により探索範囲を狭めることがでるため,
演算量を減らすことが可能となると同時に, マッチング演算の並列化を導入するにより, 高速のテンプレートマッチングが実現できる.
|
| 関連用語: |
ジェスチャー認識, セルフウィンドウ法 |
|
|
| 特徴量抽出(Feature Extraction) |
画像に捉えられている対象を認識・理解するために, 画像パターンを何らかの演算により, 異なる次元の空間,
すなわち特徴量空間に変換して, 目的に応じた特徴が抽出されるように演算を行うことを特徴量抽出あるいは特徴抽出と呼ぶ.
この演算から得られる量を特徴量と呼び, 目的に応じて, 様々なものが提案されている.
特徴量には大別して,
ある画素の近傍の画素データのみから演算・抽出するローカル特徴量と画像の全画素から演算抽出するグローバル特徴量が存在する.
いずれの場合でも, 演算の高速化が鍵となるが, 特にグローバル特徴量の演算は, 全画素のデータを用いた積分量 (例えば,
モーメント特徴はΣΣの演算) となり, その高速化には工夫が必要となる. |
| 関連用語: |
ジェスチャー認識,
セルフウィンドウ法, モーメント抽出 |
|
|
| モーメント抽出(Moment Extraction) |
画像のモーメントは, 画像処理における特徴量の1種である. モーメント特徴によって, 対象のサイズ (0次モーメント), 位置 (1次モーメント/0次モーメント),
傾き (2次モーメント)等の幾何情報を表現することができるとともに, パターン認識においても有用な特徴量として利用されている.
本研究室では, モーメント特徴の演算をアナログの並列回路や画素ごとにプロセッシングエレメントを搭載する超並列回路を利用することで高速に演算するいくつか方法を提案し,
実際に重心位置の計算で利用している. |
| 関連用語: |
ジェスチャー認識,
セルフウィンドウ法, 特徴量抽出 |
|
|
| 流体・粒子計測(Real Time Fluid/Particle Mesurement) |
流体あるいは流体に混入した粒子の動きをリアルタイムで計測する技術.
画像を用いた流体計測では, 流体中に粒子を散布し,
その移動・位置情報から流速分布を時系列に得るPIV: Particle Image Velocimetryがよく知られている.
フレームレートが不十分で粒子運動の直接計測ができない場合には, 粒子へ照射した光の散乱を観測し,
統計的な処理によって粒子数やサイズを特定する方法が用いられていた.
これに対して, 本研究室で開発したリアルタイム多点計測は, 高速画像処理により,
通常オフラインでしか実行されない流体計測のリアルタイム化やパターン解析がリアルタイムで実現できるため,
粒子群のより高度な計測を行うことが可能となる. |
| 関連用語: |
多点計測, モーメント抽出,
フレームレート, イメージャの感度,
グローバル シャッター
| |
|
| 書籍電子化(Book Scanning) |
紙媒体の書籍に印刷されている情報を電子化するための技術.
書籍スキャンあるいは書籍スキャニングとも呼ばれる. ネットワークや検索技術の発達並びに電子書籍の進歩に伴い,
書籍を電子化するニーズが全世界で急速に拡大している. 現在の技術は,
コピーやフラットベットスキャナ等で培われてきた技術を活用したものが多く,
膨大な書籍を電子化するための技術としては, 速度と手軽さの面で十分ではない. 当研究室では, 書籍電子化の新しい方法として,
ユーザがページをめくっている間に, 紙面の動きを止めることなく, 連続的に書籍を読み取る方法を提案し, 試作を行っている.
この技術は, 高速3次元形状計測技術を用いて, ページめくりの最中のページの3次元形状を取得し,
その形状情報を用いて撮像した映像をフラットなページ情報に変換する方法を用いており, 書籍を裁断する必要がなく,
なおかつ書籍を上向きのままでスキャン可能である. |
| 関連用語: |
高速画像処理, 並列画像処理,
構造照明法, 多点計測,
3次元計測
| |
|
| ジェスチャー認識(Gesture Recognition) |
人間のジェスチャーを動作として認識する技術.
ジェスチャーに応じた意味づけを行うことにより, 機器の操作を行うことを目的とする.
手だけの動作を対象とする場合と指の動きまで利用する場合があり, 前者は高速のジェスチャーの認識が,
後者は細かい指の動きを捉えることが課題である. テレビ (5m~3m), ゲーム・デジタルサイネージ (3m~1m),
コンピュータ (30cm~1m), 携帯機器・カーナビ(10cm~30cm)等における機器操作に応用することが考えられている.
この際の手指の速度は, 通常のジェスチャーの手首の速度で50km/h程度と考えられ, 最高速度としては,
指先の動きで150km/h, 手首で100km/h程度と考えられる.
これらの速度に対応した画像処理が必要で有り, 3次元認識が求められる場合もある.
出力は, 代表特徴点の時系列位置情報からパターン抽出を行い,
ジェスチャーの意味の認識を行う場合が多い. |
| 関連用語: |
高速画像処理, 特徴量抽出,
モーメント抽出, フレームレート,
空間分解能
| |
|
|
|