Upload
kasen
View
41
Download
3
Embed Size (px)
DESCRIPTION
継続的物流ABC/ABMのための 音声認識記録システムについて. 2000728 田中 裕一. 指導教官 鶴田三郎 教授 黒川久幸 助教授. 目次. はじめに 音声認識記録システムの開発 評価 まとめ. 物流改善のための物流ABC/ABM. Activity :活動(局所的な仕事の単位). コストはいくらかかっているのか?. ABC:活動基準原価計算 ( Activity-Based Costing ). プロセスに 無駄はないか?. ABM:活動基準管理 ( Activity-Based Management ). - PowerPoint PPT Presentation
Citation preview
継続的物流ABC/ABMのための音声認識記録システムについて
指導教官 鶴田三郎 教授 黒川久幸 助教授
2000728 田中 裕一
はじめに音声認識記録システムの開発評価まとめ
目次
Activity :活動(局所的な仕事の単位)
コストはいくらかかっているのか?
ABC:活動基準原価計算( Activity-Based Costing )
ABM:活動基準管理( Activity-Based Management )
プロセスに
無駄はないか?
荷受け・検品;ケースピース(バラ)大物(特殊)
格納;コンベアフォーク台車・手荷役大物(特殊)
平置きラック
ピッキング準備ピッキング;ケース
ピース(バラ)大物(特殊)
目視検品;ケースピース(バラ)大物(特殊)
機械検品;ケースピース(バラ)大物(特殊)
梱包;ダンボール大物(特殊)
行き先別仕分け荷札貼り
値札付け袋詰め個別包装チラシ類の封入販促品の取り付け
受入れ・検品再生棚戻し仕入先返品
ピッキングリストの作成納品伝票の作成荷札の作成
管理業務片付け・清掃保管品の整理
情報処理
管理
保管
入荷 出荷
流通加工
返品
物流施設内アクティビティ
物流改善のための物流ABC/ABM
(出所:中小企業庁「物流 ABC 準拠による物流コスト算定・効率化マニュアル」より作成)
ケース機械検品
ケース目視検品
袋詰め
バラピッキング
台車格納フォークリフト格納 土地・建物
待機
作業時間データの収集
人
機械設備資材消耗品
投入要素
人件費
作業日報作成の手間
時刻アクティビティ 10 11 129
作業者名
記録日
ケース荷受け・検品
大物荷受け・検品
・・・
台車・手荷役格納
ラック保管
記入表(午前)
待機(機械故障等)
時刻アクティビティ 10 11 129
作業者名
記録日
ケース荷受け・検品
大物荷受け・検品
・・・
台車・手荷役格納
ラック保管
記入表(午前)
待機(機械故障等)
時刻アクティビティ 10 11 129
作業者名
記録日
ケース荷受け・検品
大物荷受け・検品
・・・
台車・手荷役格納
ラック保管
記入表(午前)
待機(機械故障等)
時刻アクティビティ 10 11 129
作業者名
記録日
ケース荷受け・検品
大物荷受け・検品
・・・
台車・手荷役格納
ラック保管
記入表(午前)
待機(機械故障等)
開始と終了を結んだ線を引く
頻繁に記録する場合は手間が大
きい
研究の目的
作業記録の入力にかかる負担を軽減するツールとして音声認識を活用した記録システムを構築する
構築したシステムの有効性を明らかにする
物流ABC/ABM導入を推進
はじめに音声認識記録システムの開発評価まとめ
目次
システムの設計要件
誰にとっても使い易い
自由に動き回れる音声によってシステムを操作できる
語彙の登録を柔軟に行える
話者の特徴に合わせられる
物流現場の騒音に耐えうる
例)無線接続
スピーカ
マイクロフォン
端末
単語辞書データベース
音声認識処理部
命令処理部
作業記録データベース
音声認識OCXドキュメントトーカ
プログラミング開発ソフトウェア Visual Basic6.0
データベースソフトウェア Microsoft Access
WireOrWireless
システムの構成
終了大物荷受け・検品流通情報工学課程10:002004/01/074
30開始大物荷受け・検品流通情報工学課程9:302004/01/073
15終了ケース荷受け・検品流通情報工学課程9:152004/01/072
15開始ケース荷受け・検品流通情報工学課程9:002004/01/071
次の記録までの時間(分)
開始/終了アクティビティ顧客時刻日時ID
終了大物荷受け・検品流通情報工学課程10:002004/01/074
30開始大物荷受け・検品流通情報工学課程9:302004/01/073
15終了ケース荷受け・検品流通情報工学課程9:152004/01/072
15開始ケース荷受け・検品流通情報工学課程9:002004/01/071
次の記録までの時間(分)
開始/終了アクティビティ顧客時刻日時ID
実働時間ロス時間
実働時間
単語辞書データベースの設定
単語辞書となるテキストを指定
認識レベルの指定認識時間の指定
制御用単語の指定
ユーザの指定記録フォームへ
記録フォームの画面入力形式の選択
音声ファイルの参照
音声ファイル再生
フォームの終了
音声認識の開始
音声認識の停止
認識結果
音量メータ
記録の手順
書き込み制御用単語を発声する
書き込みが可能になったことを告げる応答音を確認
記録項目を発声する
記録が完了したことを告げる応答音を確認
顧客:流通情報工学課程
アクティビティ:ケース荷受け・検品
開始
入力の一例①
はじめ
りゅうつう
けーすにうけ
入力の一例②
マイク
Pi !
作業者 記録フォーム画面
入力の一例③
作業の記録りゅうつうけーすにう
けはじめ
PiPi !
作業者 記録フォーム画面ID
日時 時刻 顧客 アクティビティ 開始/終了次の記録までの時間
1 2004/01/20
2:03流通情報工学課程 ケース荷受け・検
品開始
はじめに音声認識記録システムの開発評価まとめ
目次
①PTS(Predetermined time standard)法の基本動作を参考にして入力作業を基本動作(手をのばす、つかむ等)に分割。②分割した基本動作に順序を定めて、その通りに入力作業を行う。
用紙を掴む~記入する~用紙を置く
端末をポケットから取り出す~ボタン入力~端末をポケットに仕舞う
記録用紙への筆記記入
ハンディ端末へのボタン入力
測定の方法(用紙記入、端末入力)
用紙記入の想定
時刻アクティビティ 10 11 129
顧客名 流通情報工学課程
作業者名
記録日
ケース荷受け・検品
大物荷受け・検品
フォークリフト格納
・・・
台車・手荷役格納
ラック保管
9時32分ならここに点を記入する1cm
記入表(午前)
①手が自然に下がっている状態から記録用紙及び筆記具まで手をのばす(記録用紙及び筆記具は正面の腰の高さ位置に置かれている)②記録用紙及び筆記具をつかむ③記入用紙を胸の位置まで運ぶ④正面にある掛け時計(アナログ)で時刻を確認する⑤記入欄を確認する⑥筆記具を記入位置まで運ぶ⑦記入する(点付け)⑧記入用紙及び筆記具を置く⑨手を自然な状態に下げる
赤:手の使用青:眼の使用
用紙記入の基本動作と順序
平均 8.5秒
端末入力の想定
顧客メニュー
2.・・・3.・・・
9.・・・0.その他
1.流通情報工学アクティビティメニュー
2.・・・3.・・・
9.・・・0.その他
1.ケース入荷・検品
登録メニュー
2.開始3.・・・
9.・・・0.その他
1.終了
画面① 画面②
画面③
確定ボタン
ホームポジション(テンキーの5)
テンキーの1
顧客メニュー
2.・・・3.・・・
9.・・・0.その他
1.流通情報工学
重さ:約106gサイズ:幅48×高さ約175×厚さ25(mm)
①手が自然に下がっている状態からズボンの前ポケットまで手をのばす②端末をつかむ③端末をポケットから取り出す④端末を胸の位置まで運ぶ⑤端末のボタンを押す(まず親指がホームポジションの位置に置かれている。ここから画面を確認し、テンキーの1を親指で押した後にホームポジションに戻す。これを3度行い、最後に親指で確定ボタンを押す)⑥端末をポケットに運ぶ⑦端末をポケットにしまう⑧手を自然な状態に下げる
赤:手の使用青:眼の使用
端末入力の基本動作と順序
平均 9.9秒
音声入力の想定・動作順序
① 書き込み制御単語を発声する② 応答音から書き込みがONになったことを確認する③ 作業記録を発声する 「りゅうつう、けーすにうけ、おわり」④ 応答音から記録が完了したことを確認する
緑:音声の使用橙:耳の使用環境条件
CPU CLOCK :2.66 GHz 騒音40 d B程度の室内
平均 5.3秒
8.5秒 9.9秒
5.3秒
記録用紙への筆記記入 ハンディ端末へのボタン入力
入力方法と所要時間
音声認識記録システムによる音声入力
りゅうつう、けーすにうけ、
おわり
けーすにうけ、おわり
おわり
単語数3
単語数2
単語数1
5.3秒
4.4秒
3.3秒
85%
85%
100%
検出成功率
入力の所要時間
検出成功率
17/20回
17/20回
20/20回
はじめに音声認識記録システムの開発評価まとめ
目次
まとめ①
業務の妨げにならず記録を行えるツールの必要性から音声認識記録システムを構築
音声認識記録システムによる音声入力は記録用紙及びハンディ端末を用いるよりも
短時間での入力が可能
眼や手を用いることなく記録を行えるため、これらの部位を他の作業へ使用可能
まとめ②
似た音を持つ意図しない単語が誤って認識されることが現在の技術では存在するため、
単語辞書を必要となる単語のみに絞ることで認識精度の向上につながるものと思われる
業務作業の記録が容易になり、継続した物流ABC/ABMに役立つと考えられる
今後の課題
誰にとっても使い易い
自由に動き回れる音声によってシステムを操作できる
語彙の登録を柔軟に行える
話者の特徴に合わせられる
物流現場の騒音に耐えうる
例)無線接続
特定話者に対応した音響モデルを用い、音素レベルでの認識精度を向上させること
誤認識の修正や発声の癖を学習する適応化技術を取り入れること
発話内容の推測を行い、認識を助ける工夫を取り入れること
ご清聴頂きありがとうございました
フレーム
フレーム周期
特徴ベクトル
音声波から特徴ベクトル(短時間スペクトル)時系列を抽出する方法
音声波
時間窓時間
振幅
スペクトル包絡
周波数〔kHz〕
10 2 3 4 5
0
-10
-20
-30
-40
-50
-60
対数パワ
ー
[dB]
波形のパワースペクトル(母音 /a / )
F1
F2
F3
F4
「い」のモデル
「あ」のモデル
××
×
×
×
×
音響モデル
平均
入力された音
1.0 0.0
0.4
入力された音が「あ」である確率
母音に対する音響モデルの例
テキストファイル
発音 表記
けーす=ケースぴーす|ばら=ピースばーす=バース
S:EK U
音響モデルで作られた音声データ
語彙登録のためのテキストファイル作成
0 500 1000 1500
認識上限
スコア点数
入力パターンに対する標準パターンの第一候補
入力パターンに対する標準パターンの第二候補
正解
スペクトル距離計算
各項目に分割認識結果
記録フォーム(単語数2)
入力音声信号
音響特徴量抽出
スペクトル距離計算 単語照合 認識結果
(単語)
音響モデル 発音辞書
単語音声認識の仕組み
003_11_05.wav
音声
11時05分に録音したことを表している
音声ファイルからの時刻取得