54
#techcy

Technoleg Cymraeg

Embed Size (px)

DESCRIPTION

Cyflwyniad am dechnoleg Cymraeg, sut i oroesi 'digital extinction' (G. Rehm) i Grwp Hyrwyddo'r Gymraeg yn Llandrindod Hydref 2014. Welsh-language presentation about Welsh language technology to representatives of organisations which promote the use of the Welsh language. Llandrindod Wells, October 2014.

Citation preview

Page 1: Technoleg Cymraeg

#techcy

Page 2: Technoleg Cymraeg
Page 3: Technoleg Cymraeg

Tech. Cymraeg

gan Gareth Morlais

Uned y Gymraeg Llywodraeth Cymru

Page 4: Technoleg Cymraeg
Page 5: Technoleg Cymraeg

Ieithoedd y Byd

• Hyd at 7,000 iaith yn y byd

• 90% ohonyn nhw gyda llai na 100,000 siaradwr/aig

• 832 iaith yn Papua New Guinea

• 260 iaith yn Ewrop

• 46 iaith gyda dim ond un siaradwr

(UNESCO, Infolang, BBC Languages)

Page 6: Technoleg Cymraeg
Page 7: Technoleg Cymraeg
Page 8: Technoleg Cymraeg
Page 9: Technoleg Cymraeg
Page 10: Technoleg Cymraeg
Page 11: Technoleg Cymraeg

Georg Rehm META-NET

Page 12: Technoleg Cymraeg
Page 13: Technoleg Cymraeg

http://www.meta-net.eu/whitepapers/press-release G Rehm, H UszkoreitMedi 2012

Page 14: Technoleg Cymraeg

Categoriau eraill: Machine TranslationSpeech ProcessingText Analysis

Page 15: Technoleg Cymraeg
Page 16: Technoleg Cymraeg
Page 17: Technoleg Cymraeg

Sut i oroesi yn yr oes ddigidol. Canllaw i ieithoedd

Page 18: Technoleg Cymraeg

1. Adnoddau iaith

Geiriaduron, termiaduron ac

adnoddau cysylltiedig (Maint?

Perchnogaeth a thrwyddedu?

Safoni?)

Corpora – testun, iaith lafar a

corpora amlieithog cyfatebol

Gwyddoniaduron megis Wikipedia

Gwiro sillafu a gramadeg

Deallusrwydd artiffisial a

dealltwriaeth iaith

1. Language resources

Dictionaries, term

dictionaries

and associated dictionary

resources

(size? IP/licensing?

Standardised?)

Corpora – text, speech

and matched

bi/multilingual corpora

Encyclopaedia such as

Wikipedia

Spell & grammar (rule)

checker

Artificial Intelligence (AI)

and language

‘understanding’

Page 19: Technoleg Cymraeg

2. Dadansoddi testun

OCR: adnabod geiriau wedi eu sganio

(cipio testun ystyrlon o ddelweddau o

ddogfennau)

Sgriptiau rheolau gramadegol

Injan dadansoddiad a thagio gramadeg

yn awtomatig (strwythur iaith)

Peiriant dadansoddiad a thagio

semanteg awtomatig (Ystyr iaith a

gwella dealltwriaeth o’r cyd-destun er

mwyn datblygu deallusrwydd artiffisial

a dadansoddi sentiment)

Systemau tagio sy’n cysylltu termau

Cymraeg gyda rhai cyfystyr mewn

ieithoedd eraill

2. Text Analytics

Optical Character Recognition

(captures meaningful text from

document scans)

Grammar rule scripts

Automatic grammar analysis

and tagging engine (this is

about language structure)

Automatic semantic analysis

and tagging engine (this is

about language meaning,

context and improving

understanding. Aids AI and can

be used for sentiment analysis)

Meta tagging systems, linking

content and assets in your

language to others

Page 20: Technoleg Cymraeg

3. Llais

Adnabod gorchmynion Cymraeg

(dwi’n dweud "S4C" er mwyn newid

sianel y teledu)

Llais i destun (dwi’n dweud "S4C" ac

mae’r gair yn cael ei deipio gan

Word)

Llais synthetig Cymraeg (mae

cyfrifiadur yn darllen y gair "S4C" ac

yn ei 'ddweud'. E.g. Gwyneth a

Geraint, lleisiau Cymraeg RNIB)

Y ‘glud’ sy’n cysylltu’r holl

dechnolegau llais gyda deallusrwydd

artiffisial

3. Speech

Speech command recognition

(say “S4C” and TV changes to

S4C)

Speech-to-text (say “S4C” and

this word is typed into Word)

Synthetic speech (computer

reads the word “S4C” and ‘says’

it)

Text-to-speech and AI-to-speech

linkage systems

Page 21: Technoleg Cymraeg

4. Cyfieithu peirianyddol

Cofau cyfieithu

Cefnogaeth i’r Gymraeg mewn

pecynnau megis Deja Vu

Dulliau ystadegol a dulliau sy’n

seiliedig ar reolau

Dulliau i wella’r rhaglenni drwy

‘dysgu’ o gywiriadau cyfieithwyr go

iawn.

4. Machine translation

Translation memories

Support for language by

commercial packages such as

Deja Vu

MT using statistical and rule-

based methods

Post editing feedback systems

Page 22: Technoleg Cymraeg

5. Cefnogaeth cwmnïau mawr

Google (rhyngwynebau Cymraeg,

cydnabod y Gymraeg fel un o

‘ieithoedd chwilio’ Google,

GoogleTranslate)

Microsoft (pecyn iaith, cyfieithu)

Apple: lleoleiddio

Ac eraill

5. Support by major companies

Google (interfaces, search

language, translate)

Microsoft (language pack,

translate)

Apple localization

Others

Page 23: Technoleg Cymraeg

6. Daearyddol

Gallu mewnosod mapiau rhyngweithiol

gydag enwau llefydd yn yr iaith

Data am adnoddau ieithyddol daearyddol

7. Cymdeithasol

Cyflwyno cynnwys mewn un fan (e.e.

ffrwti.com)

Gwefannau lleol (e.e. poblcaerdydd.com)

Apiau sy’n dod â phobl at ei gilydd i

sgwrsio yn y byd go iawn (e.e. Ap fy Ardal

yr Urdd)

6. Geographical

Interactive embeddable maps

Data about geographical linguistic

resources

7. Social

Content aggregation applications

(like ffrwti.com)

Local reporting platforms (like

poblcaerdydd.com)

Face-to-face interaction inspiration

(like Ap Fy Ardal yr Urdd)

Page 24: Technoleg Cymraeg

8. Sgiliau

Siaradwyr yr iaith gyda gwybodaeth

am gyfrifiadureg a thechnoleg iaith.

9. A.y.b.

8. Skills

Citizens with coding and language

technology skills.

9. Etc.

Page 25: Technoleg Cymraeg
Page 26: Technoleg Cymraeg
Page 27: Technoleg Cymraeg

Cynllun gweithredu technoleg a’r cyfryngau digidol Cymraeg

1: Marchnata a chodi ymwybyddiaeth2: Ysgogi’r prif gwmnïau technoleg3: Ysgogi datblygiad o becynnau meddalwedd a gwasanaethau digidol Cymraeg newydd4: Ysgogi creu, rhannu a defnyddio cynnwys digidol Cymraeg 5: Cefnogi arfer da yn y sector cyhoeddus, y sector preifat a’r trydydd sector

Page 29: Technoleg Cymraeg
Page 30: Technoleg Cymraeg
Page 31: Technoleg Cymraeg
Page 32: Technoleg Cymraeg
Page 33: Technoleg Cymraeg
Page 34: Technoleg Cymraeg
Page 35: Technoleg Cymraeg
Page 36: Technoleg Cymraeg
Page 37: Technoleg Cymraeg
Page 38: Technoleg Cymraeg
Page 39: Technoleg Cymraeg
Page 40: Technoleg Cymraeg
Page 41: Technoleg Cymraeg
Page 42: Technoleg Cymraeg
Page 43: Technoleg Cymraeg
Page 44: Technoleg Cymraeg
Page 45: Technoleg Cymraeg
Page 46: Technoleg Cymraeg
Page 47: Technoleg Cymraeg

2013/14

Ffrwti.com

Ap Paldaruo a braich robot sy'n deallt Cymraeg

Ap Stori ni i greu a rhannu newyddion lleol

Partneriaeth Penrhys – apiau i blant bach a chlwb codio

Meddalwedd i hwyluso creu apiau dysgu Cymraeg - Prifysgol

Aberystwyth

Yr Urdd: Ap fy Ardal

Apiadur

Page 48: Technoleg Cymraeg

2014/15

O Glust i Glust - Menter Môn

Lingua-Skin - Interceptor Solutions Ltd

WordPress i Bawb - NativeHQ

Mentrau Iaith Cymru – Troedio

Cam o’r Tywyllwch - Recordiau Peski

Mudiad Ffermwyr Ifanc Cymru - ap Estyn Llaw

Ap Canolfan Cymraeg i Oedolion Caerdydd a Bro Morgannwg

Digidol ar Daith - Prifysgol Caerdydd

Page 49: Technoleg Cymraeg
Page 50: Technoleg Cymraeg
Page 51: Technoleg Cymraeg
Page 52: Technoleg Cymraeg
Page 53: Technoleg Cymraeg

Categoriau eraill: Machine TranslationSpeech ProcessingText Analysis

Page 54: Technoleg Cymraeg

Cefndir:gan Gareth Morlais Hydref [email protected]

Cydnabyddiaeth:Jeremy Evas (Prifysgol Caerdydd); Georg Rehm (Meta-Net); Iwan Evans, Heledd Daniel a Gareth Cardew-Richardson, Llywodraeth Cymru