아마존, 구글 사례 중심의 영상처리기술 응용 트렌드



세계적인 IT 기업들은 영상처리 및 컴퓨터 비전 기술을 어떻게 사용하는지 사례들을 살펴보고 앞으로 어떠한 서비스로 발전할지를 살펴보기 위한 T아카데미 테크클리닉 강연 자료

Citation preview

아마존, 구글 사례 중심의 영상처리기술 응용 트렌드

Image Processing Team 한주현

한주현 ManagerSK planet Image Processing Team 서강대학교 영상대학원 미디어공학석사 !3D Vision, 증강현실, 영상기반 UX 연구

현재 영상처리 기술이 이용된 어떤 서비스를 사용 중이신가요?

그 외에는? !

사실 영상처리 기술은 …

영상 처리 기술은 특수한 분야에서 주로 사용

의료 영상

위성 및 항공 촬영 영상

보안 및 통제용 영상

제한된 환경에서 획득한 영상을 처리하는 것이 비교적 쉽기 때문


스마트폰은 카메라도 있는데

쿼드코어 CPU도 있는데 인터넷도 연결되는데

Why Not?

Beyond QR Code


Uber 카드 번호 인식 영상

Optical Character Recognize

문자말고 이미지는?



컴퓨터가 아닌 사람

Recognize, Like The Human Eye

“Deep Learning”

기존 기계 학습은 사람이 수동으로

데이터의 각종 특징들을 설계한 후 학습

딥 러닝은 데이터로부터 자동적으로 특징들을 학습하고

분류, 인식까지 통합하여 수행

Google은 딥 러닝으로 고양이를 찾았는데

•16,000개의 CPU 코어를 사용했다 •비지도학습 즉, 고양이를 알려주지 않고 학습을 했다

세계적 IT기업들은 딥 러닝 기술을 수혈


곧 놀라운 서비스를 기대

2014. 06. 18.


이미지 인식 텍스트 인식 사운드 인식

인식에 사용된 기술Adaptive local contrast enhancement, Adaptive noise reduction, Glare detection, Shadow removal, Underline removal, Two phase MSER scanning, Orientation

normalization, Multiframe combination, Multiple OCR engines, Page layout analysis, Truncation filtering, Multiframe super-resolution, Confidence filtering, Hybrid 2-pass scanning, Adaptive scaling, Automatic cropping, Flexible orientation, Accumulated

signed gradient patch operation, …

Dynamic Perspective

입체적인 시각 제공 시각에 맞는 UX 제공

Amazon은 왜 Dynamic Perspective를


X, Y, Z 3 Dimension

3D Reconstruction 3D Scanning

Google Project Tango3D Scanning into Android Phone


Next Commerce를 위한 영상처리 및 컴퓨터비전 기술 개발

Paypal card.io - https://www.card.io/ iOS 8 Safari now scans credit cards with iPhone camera, quick contacts come to multitasking view, Apple insider - http://appleinsider.com/articles/14/06/09/ios-8-safari-now-scans-credit-cards-with-iphone-camera-quick-contacts-come-to-multitasking-view Jumio - https://www.jumio.com/ CamFind - http://camfindapp.com/ Facebook's DeepFace Software Can Match Faces With 97.25% Accuracy, Forbes - http://www.forbes.com/sites/amitchowdhry/2014/03/18/facebooks-deepface-software-can-match-faces-with-97-25-accuracy/ Using large-scale brain simulations for machine learning and A.I., Google official blog - http://googleblog.blogspot.kr/2012/06/using-large-scale-brain-simulations-for.html DeepMind - http://www.deepmind.com/ LookFlow - http://lookflow.com/ Amazon Press Conference: Jeff Bezos introduces Fire phone, the first smartphone designed by Amazon, Youtube Video - http://www.youtube.com/watch?v=w95kwXy_MOY Seene - http://www.seene.co/ Autodesk 123D Catch - http://www.123dapp.com/catch Done Deal: Apple Confirms It Acquired Israeli 3D Sensor Company PrimeSense, Tech crunch - http://techcrunch.com/2013/11/24/apple-primesense-acquisition-confirmed/ MatterPort - http://matterport.com/ Google Project Tango - https://www.google.com/atap/projecttango/#project Paracosm - https://paracosm.io/


Thank You

Image Processing Team | 한주현 | juhyeun.han@sk.com
