20
Amazon Polly

Amazon Polly - maff.go.jp · 大カテゴリ 小カテゴリ サービス 映像 画像認識 Amazon Rekognition 動画認識 Amazon Rekognition Video テキスト認識 Amazon Textract

  • Upload
    others

  • View
    1

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Amazon Polly - maff.go.jp · 大カテゴリ 小カテゴリ サービス 映像 画像認識 Amazon Rekognition 動画認識 Amazon Rekognition Video テキスト認識 Amazon Textract

Amazon Polly

Page 2: Amazon Polly - maff.go.jp · 大カテゴリ 小カテゴリ サービス 映像 画像認識 Amazon Rekognition 動画認識 Amazon Rekognition Video テキスト認識 Amazon Textract

© 2019, Amazon Web Services, Inc. or its Affiliates. All rights reserved.

Amazon Polly

• テキストを、リアルな音声に変換するサービス

• 地域の方言も考慮した25種以上の言語で、 50 以上のリアルな声優の音声を提供

• 音声の保存と配信、SSML*と Lexicon**によるカスタマイズが可能

• リップシンクのためのスピーチマーク機能や、ささやき声の発話機能も

<lexeme>

<grapheme>Kaja</grapheme>

<grapheme>kaja</grapheme>

<grapheme>KAJA</grapheme>

<phoneme>"kaI.@</phoneme>

</lexeme>

My daughter’s name is Kaja.ねぇちょっとちょっと、ここだけの話だけどさ

<speak>

<prosody rate="x-fast">

ねえ、ちょっとちょっと、<amazon:effect name="whispered">

ここだけの話だけどさ</amazon:effect>

</prosody>

</speak>

SSML Lexicon

日本語

Page 3: Amazon Polly - maff.go.jp · 大カテゴリ 小カテゴリ サービス 映像 画像認識 Amazon Rekognition 動画認識 Amazon Rekognition Video テキスト認識 Amazon Textract

© 2019, Amazon Web Services, Inc. or its Affiliates. All rights reserved.

Polly の品質

自然に聞こえる音声

テキスト変換処理の正確さ• Today in Las Vegas、 NV it's 90°F.

• "We live for the music"、 live from the Madison Square Garden.

高度なわかりやすさ• 庭には二羽の鶏がいる

Page 4: Amazon Polly - maff.go.jp · 大カテゴリ 小カテゴリ サービス 映像 画像認識 Amazon Rekognition 動画認識 Amazon Rekognition Video テキスト認識 Amazon Textract

© 2019, Amazon Web Services, Inc. or its Affiliates. All rights reserved.

25 以上の言語、50 以上の音声に対応

言語 女性 男性

標準中国語 Zhiyu

英語(オーストラリア) Naja Mads

英語(インド) Aditi (ヒンディー語のバイリンガル)Raveena

日本語 Mizuki Takumi

韓国語 Seoyeon

ヒンディー語 Aditi

ヨーロッパ/中東/アフリカ地域: アジア太平洋地域:

北アメリカ/南アメリカ地域:

言語 女性 男性

フランス語(カナダ) Chantal

ポルトガル語(ブラジル) Vitória Ricardo

英語(米国) Joanna Joey

Salli Justin

Kendra Matthew

Kimberly

Ivy

スペイン語(米国) Penélope Miguel

スペイン語(メキシコ) Mia

言語 女性 男性

デンマーク語 Naja Mads

オランダ語 Lotte Ruben

フランス語 Céline Mathieu

ドイツ語 Marlene Hans

Vicki

アイスランド語 Dóra Karl

イタリア語 CarlaBianca

Giorgio

ノルウェー語 Liv

ポーランド語 Ewa Jacek

Maja Jan

ポルトガル語(イベリア) Inês Cristiano

ルーマニア語 Carmen

ロシア語 Tatyana Maxim

スペイン語(カスティリヤ) Conchita

Lucia

Enrique

https://docs.aws.amazon.com/polly/latest/dg/voicelist.html

言語 女性 男性

スウェーデン語 Astrid

トルコ語 Filiz

英語(英国) Amy Brian

Emma

英語(ウェールズ) Geraint

ウェールズ語 Gwyneth

ヨーロッパ/中東/アフリカ地域:

Page 5: Amazon Polly - maff.go.jp · 大カテゴリ 小カテゴリ サービス 映像 画像認識 Amazon Rekognition 動画認識 Amazon Rekognition Video テキスト認識 Amazon Textract

© 2019, Amazon Web Services, Inc. or its Affiliates. All rights reserved.

Polly 事例: FM 和歌山さま

• 完全に自動化されたキャスター不要のニュース配信が可能に

• 安定してアナウンサーを確保するのが難しい状況でもニュース配信が可能

• 今後は災害情報等のタイムリーな発信にも確保していく予定

Page 6: Amazon Polly - maff.go.jp · 大カテゴリ 小カテゴリ サービス 映像 画像認識 Amazon Rekognition 動画認識 Amazon Rekognition Video テキスト認識 Amazon Textract

© 2019, Amazon Web Services, Inc. or its Affiliates. All rights reserved.

自然言語処理

Page 7: Amazon Polly - maff.go.jp · 大カテゴリ 小カテゴリ サービス 映像 画像認識 Amazon Rekognition 動画認識 Amazon Rekognition Video テキスト認識 Amazon Textract

© 2019, Amazon Web Services, Inc. or its Affiliates. All rights reserved.

AWS AIサービスポートフォリオ

大カテゴリ 小カテゴリ サービス名

映像

画像認識 Amazon Rekognition

動画認識 Amazon Rekognition Video

テキスト認識 Amazon Textract

音声Speech-to-Text Amazon Transcribe

Text-to-Speech Amazon Polly

自然言語

自然言語理解 Amazon Comprehend

医療文書理解 Amazon Comprehend Medical

テキスト翻訳 Amazon Translate

チャットボット Amazon Lex

re:Invent

update

re:Invent

update

日本語

日本語

Page 8: Amazon Polly - maff.go.jp · 大カテゴリ 小カテゴリ サービス 映像 画像認識 Amazon Rekognition 動画認識 Amazon Rekognition Video テキスト認識 Amazon Textract

Amazon Comprehend

Page 9: Amazon Polly - maff.go.jp · 大カテゴリ 小カテゴリ サービス 映像 画像認識 Amazon Rekognition 動画認識 Amazon Rekognition Video テキスト認識 Amazon Textract

© 2019, Amazon Web Services, Inc. or its Affiliates. All rights reserved.

Amazon Comprehend

テキスト(英語を含む6言語、日本語非対応)に対して以下の分析が可能

センチメント分析(ポジティブ・ネガティブ判定)

エンティティ(固有名詞等)の判定

言語の判定

文章中の代表的なキーフレーズ抽出

トピックモデリング(複数文書をトピックで分類)

構文解析(品詞などの識別)

Page 10: Amazon Polly - maff.go.jp · 大カテゴリ 小カテゴリ サービス 映像 画像認識 Amazon Rekognition 動画認識 Amazon Rekognition Video テキスト認識 Amazon Textract

© 2019, Amazon Web Services, Inc. or its Affiliates. All rights reserved.

Amazon Comprehend エンティティー抽出

Page 11: Amazon Polly - maff.go.jp · 大カテゴリ 小カテゴリ サービス 映像 画像認識 Amazon Rekognition 動画認識 Amazon Rekognition Video テキスト認識 Amazon Textract

© 2019, Amazon Web Services, Inc. or its Affiliates. All rights reserved.

Amazon Comprehend 感情分類

感情的ではない

Page 12: Amazon Polly - maff.go.jp · 大カテゴリ 小カテゴリ サービス 映像 画像認識 Amazon Rekognition 動画認識 Amazon Rekognition Video テキスト認識 Amazon Textract

© 2019, Amazon Web Services, Inc. or its Affiliates. All rights reserved.

Amazon Comprehend のカスタマイズ

• カスタム語彙

• ドメインに固有の専門用語を登録することができる

• Comprehend は登録された用語を識別して分析できる

• カスタム分類

• 文書分類のカテゴリを、要望に合わせて登録でき、オリジナルの文書分類モデルを構築できる

航空会社におけるカスタム分類の例

Page 13: Amazon Polly - maff.go.jp · 大カテゴリ 小カテゴリ サービス 映像 画像認識 Amazon Rekognition 動画認識 Amazon Rekognition Video テキスト認識 Amazon Textract

© 2019, Amazon Web Services, Inc. or its Affiliates. All rights reserved.

ユースケース: カスタマーの声を分析

Twitter 等のデータを読み込んで Comprehend でタグ付けや分類を行い、Redshift で分析

Page 14: Amazon Polly - maff.go.jp · 大カテゴリ 小カテゴリ サービス 映像 画像認識 Amazon Rekognition 動画認識 Amazon Rekognition Video テキスト認識 Amazon Textract

© 2019, Amazon Web Services, Inc. or its Affiliates. All rights reserved.

ユースケース: コールセンターの音声データの可視化

AWS Lambda

Amazon S3

Amazon Athena

Audio Input

Amazon QuickSight

Amazon Comprehend

Amazon Transcribe

• 音声データをS3に保存し、LambdaからTranscribeを実行してテキスト化

• テキスト化した文章から、音声対話のポジティブ/ネガティブをComprehendで判定し、Athenaで集計、QuickSightで可視化

Page 15: Amazon Polly - maff.go.jp · 大カテゴリ 小カテゴリ サービス 映像 画像認識 Amazon Rekognition 動画認識 Amazon Rekognition Video テキスト認識 Amazon Textract

© 2019, Amazon Web Services, Inc. or its Affiliates. All rights reserved.

Amazon Comprehend Medical

• Amazon Comprehendの拡張サービスで、医療文書向けに特化した拡張を行ったもの

• 症状、治療法、医薬品等の用語に対応している

• 医療上の文脈やエンティティの関係性を認識

例:医薬品と投薬の頻度の関係を自動抽出

• 対応言語は英語のみ

Page 16: Amazon Polly - maff.go.jp · 大カテゴリ 小カテゴリ サービス 映像 画像認識 Amazon Rekognition 動画認識 Amazon Rekognition Video テキスト認識 Amazon Textract

© 2019, Amazon Web Services, Inc. or its Affiliates. All rights reserved.

Amazon Comprehend の解析例

po(経口投与の略語)

やqhs(就寝前) などの専門用語を識別

頻度の関係性を抽出

Page 17: Amazon Polly - maff.go.jp · 大カテゴリ 小カテゴリ サービス 映像 画像認識 Amazon Rekognition 動画認識 Amazon Rekognition Video テキスト認識 Amazon Textract

Amazon Translate

Page 18: Amazon Polly - maff.go.jp · 大カテゴリ 小カテゴリ サービス 映像 画像認識 Amazon Rekognition 動画認識 Amazon Rekognition Video テキスト認識 Amazon Textract

© 2019, Amazon Web Services, Inc. or its Affiliates. All rights reserved.

Amazon Translate

入力データとして、通常のテキストに加えてHTML のような構造化テキストにも対応

30 語以下であれば

リアルタイム翻訳可能(<500 ms)

21言語をサポートしており、日本語からは残り20

の言語への翻訳が可能

IAM や SSL、S3 暗号化など、AWS のセキュリティが適用されている

バージニア北部、オハイオ、オレゴン、そしてアイルランドで利用可能

簡単に利用可能で、CLI やSDK で他アプリケーションの連携も容易

非常に高い ROIドメイン特有の語彙・専門用語を追加できる

日本語

Page 19: Amazon Polly - maff.go.jp · 大カテゴリ 小カテゴリ サービス 映像 画像認識 Amazon Rekognition 動画認識 Amazon Rekognition Video テキスト認識 Amazon Textract

© 2019, Amazon Web Services, Inc. or its Affiliates. All rights reserved.

英語から日本語への翻訳例

It’s very difficult for human

translation teams to keep up with

dynamic or real-time content. With

Amazon Translate、 you can easily

translate massive volumes of user-

generated content in real-time.

Websites and applications can

automatically make content such as

feed stories、 profile descriptions、and comments、 available in the

user's preferred language with a click

of a “translate” button

英語 日本語

翻訳者が動的にコンテンツやリアルタイムコンテンツを把握することは非常に困難です。 Amazon Translate

を使用すると、大量のユーザー生成コンテンツをリアルタイムで簡単に翻訳できます。 ウェブサイトやア

プリケーションは、「翻訳」ボタンをクリックするだけで、フィードストーリー、プロファイルの説明、コメントなどのコンテンツをユーザーの好みの言語で自動的に作成することができます。

Page 20: Amazon Polly - maff.go.jp · 大カテゴリ 小カテゴリ サービス 映像 画像認識 Amazon Rekognition 動画認識 Amazon Rekognition Video テキスト認識 Amazon Textract

© 2019, Amazon Web Services, Inc. or its Affiliates. All rights reserved.

映像の字幕生成+ 翻訳 + 読み上げデモ