Upload
others
View
3
Download
0
Embed Size (px)
Citation preview
SobreMim
BacharelemCiênciadaComputação
Mestrado/Doutorado
Cercade20anosdeexperiênciademercado.
JavaSE/EE
Web(PHP/ASP.NET/Ruby)
Cloud
PrimeiroprojetocomRedesNeuraisem2012
2013:ZunnitTechnologies
Desafioinicial:performanceeconfiabilidade.
DesafiosdeCiênciadeDados:-SistemasdeRecomendação-AprendizadodeMáquinacorporativo.
2016:Zunnit->Kunumi
Estruturaçãodaequipetécnica
DezenasdeprojetosutilizandoAprendizadodeMáquinaemclientescorporativos.
Algunsprojetosacadêmicose"culturallandmarks"
RZOeSabotage-NEURAL(AudioOficial)Part.NegraLieFamiliaSabotage-Prod.DJCIA
EngenhariadeSoftware
Motivação
"Softwareiseatingtheworld"
Criaremantersistemasdesoftwarecomplexosquegeramvalor.
Foco
Estruturação
GerenciamentodaComplexidade
Colaboração
Agilidade
Qualidade
ParaoCientistadeDados
Academia:Pesquise,Publique,Próximo.Resultado:nenhumincentivoemrelaçãoàqualidadedecódigo
Exemplokarpathy/char-rnn
Endereçandodeficiências
EstruturaçãodeCódigo
TestesUnitários/Funcionais
MetodologiasÁgeis
VersionamentodeCódigo
AlgoritmoseEstruturasdeDados(alémdeCiênciadeDados)
TrabalhoemEquipe
CiênciadeDados
MotivaçãoTomardecisõesembasadasemdados
Aprendersoluçõesapartirdedados
Foco
Experimentação
DesenvolvimentoeAdaptaçãodealgoritmos
EncontrarExplicações
ApresentaçãoeArgumentação
"MachineLearningiseatingsoftware"
ParaoEngenheirodeSoftware
CiênciadeDadoscomeçacom"Ciência"
Maisdoquefazerperguntas,aCiênciaconsisteemaplicaroMétodoCientíficoparaencontrarrespostas.
ViesesCognitivos
ViésdeConfirmação"Tendênciadoobservadordeprocurarouinterpretarinformaçõesdeformaqueestasconfirmempré-concepçõespróprias."
Ancoragem"Tendênciaaconfiardemais,ou'ancorar-se',emumareferênciadopassadoouemumapartedainformaçãonahoradetomardecisões."
Viésdedisponibilidade"Tendêncianoqualaspessoaspredizemafrequênciadeumevento,baseando-senoquãofácilconseguemlembrardeumexemplo."
Muitosoutros Listofcognitivebiases-Wikipedia
Ograndedesafio:EstatísticaeProbabilidades
ProbabilityRules
BayesTheorem
TheMontyHallProblem-Explained
Moral:estatísticaécontra-intuitiva!!!
JakeVanderplas-StatisticsforHackers-PyCon2016.mp4
SevenEssentialMachineLearningEquations:ACribsheet(Really,thePrécis)
AlgoritmosespecíficosparaCiênciadeDados
Lembre-se:nãoreinventearoda!!!!
Tópicos
AlgoritmosSupervisionados
LinearRegression
KNN
DecisionTrees
GradientBoostedTrees
NeuralNetworks
Métricasdeavaliação
Accuracymetric
Precision/Recall
AreaundertheROCcurve
Algoritmosnão-supervisionados(Clustering)
K-Means
DBScan
ExpectationMaximization
CursosMachineLearning|Coursera
DeepLearningSpecialization-deeplearning.ai
Apenaslersobreestesalgoritmosnãovaitedaraintuiçãosobrecomoutiliza-los.Vocêprecisadeprática.
Exercíciospráticosdoscursosonline
Kaggle(masnãoentrenofetichedasmétricas)
Ética!
AprendizadodeMáquinapodeamplificarviesessociais(oucriarnovosviesesindesejaveis)
Épossívelaindaviolaraprivacidadedeindivíduos,sejadeformapropositaloudeformaacidental(vazamento)
Áreasdeestudo
Anonimização
Fairness
SocialBiases
Keynote-SomeHealthyPrinciplesAboutEthics&BiasInAI|RachelThomas@PyBay2018
DeEngenheirodeSoftwareaCientistadeDados(e
vice-versa)http://bit.ly/2H8WPmz
DeEngenheirodeSoftwareaCientistadeDados(evice-versa)http://bit.ly/2H8WPmz1.CiênciadeDados
1.1.Motivação
1.1.1.Tomardecisõesembasadasemdados
1.1.2.Aprendersoluçõesapartirdedados1.2.Foco
1.2.1.Experimentação
1.2.2.DesenvolvimentoeAdaptaçãodealgoritmos
1.2.3.EncontrarExplicações
1.2.4.ApresentaçãoeArgumentação1.3."MachineLearningiseatingsoftware"1.4.ParaoEngenheirodeSoftware
1.4.1.CiênciadeDadoscomeçacom"Ciência"
1.4.1.1.Maisdoquefazerperguntas,aCiênciaconsisteemaplicaroMétodoCientíficoparaencontrarrespostas.
1.4.1.2.ViesesCognitivos
1.4.1.2.1.ViésdeConfirmação
1.4.1.2.1.1."Tendênciadoobservadordeprocurarouinterpretarinformaçõesdeformaqueestasconfirmempré-concepçõespróprias."
1.4.1.2.2.Ancoragem
1.4.1.2.2.1."Tendênciaaconfiardemais,ou'ancorar-se',emumareferênciadopassadoouemumapartedainformaçãonahoradetomardecisões."
1.4.1.2.3.Viésdedisponibilidade
1.4.1.2.3.1."Tendêncianoqualaspessoaspredizemafrequênciadeumevento,baseando-senoquãofácilconseguemlembrardeumexemplo."
1.4.1.2.4.Muitosoutros
1.4.1.2.4.1.Listofcognitivebiases-Wikipedia
Link:https://en.wikipedia.org/wiki/List_of_cognitive_biases
1.4.2.Ograndedesafio:EstatísticaeProbabilidades
1.4.2.1.ProbabilityRules
1.4.2.2.BayesTheorem
1.4.2.3.TheMontyHallProblem-Explained
Link:https://www.youtube.com/watch?v=9vRUxbzJZ9Y
Video:http://www.youtube.com/embed/9vRUxbzJZ9Y?start=0
1.4.2.4.Moral:estatísticaécontra-intuitiva!!!
1.4.2.5.JakeVanderplas-StatisticsforHackers-PyCon2016.mp4
Link:https://www.youtube.com/watch?v=Iq9DzN6mvYA&feature=youtu.be
Video:http://www.youtube.com/embed/Iq9DzN6mvYA?start=0
1.4.2.6.SevenEssentialMachineLearningEquations:ACribsheet(Really,thePrécis)
Link:https://www.aliannajmaren.com/2017/09/09/seven-essential-machine-learning-equations-a-cribsheet/
1.4.3.AlgoritmosespecíficosparaCiênciadeDados
1.4.3.1.Lembre-se:nãoreinventearoda!!!!
1.4.3.2.Tópicos
1.4.3.2.1.AlgoritmosSupervisionados
1.4.3.2.1.1.LinearRegression
1.4.3.2.1.2.KNN
1.4.3.2.1.3.DecisionTrees
1.4.3.2.1.4.GradientBoostedTrees
1.4.3.2.1.5.NeuralNetworks
1.4.3.2.2.Métricasdeavaliação
1.4.3.2.2.1.Accuracymetric
1.4.3.2.2.2.Precision/Recall
1.4.3.2.2.3.AreaundertheROCcurve
1.4.3.2.3.Algoritmosnão-supervisionados(Clustering)
1.4.3.2.3.1.K-Means
1.4.3.2.3.2.DBScan
1.4.3.2.3.3.ExpectationMaximization
1.4.3.3.Cursos
1.4.3.3.1.MachineLearning|Coursera
Link:https://www.coursera.org/learn/machine-learning
1.4.3.3.2.DeepLearningSpecialization-deeplearning.ai
Link:https://www.deeplearning.ai/deep-learning-specialization/
1.4.3.4.Apenaslersobreestesalgoritmosnãovaitedaraintuiçãosobrecomoutiliza-los.Vocêprecisadeprática.
1.4.3.4.1.Exercíciospráticosdoscursosonline
1.4.3.4.2.Kaggle(masnãoentrenofetichedasmétricas)
1.4.4.Ética!
1.4.4.1.AprendizadodeMáquinapodeamplificarviesessociais(oucriarnovosviesesindesejaveis)
1.4.4.2.Épossívelaindaviolaraprivacidadedeindivíduos,sejadeformapropositaloudeformaacidental(vazamento)
1.4.4.3.Áreasdeestudo
1.4.4.3.1.Anonimização
1.4.4.3.2.Fairness
1.4.4.3.3.SocialBiases
1.4.4.4.Keynote-SomeHealthyPrinciplesAboutEthics&BiasInAI|RachelThomas@PyBay2018
Link:https://www.youtube.com/watch?v=WC1kPtG8Iz8
Video:http://www.youtube.com/embed/WC1kPtG8Iz8?start=0
2.EngenhariadeSoftware2.1.Motivação
2.1.1."Softwareiseatingtheworld"
2.1.2.Criaremantersistemasdesoftwarecomplexosquegeramvalor.
2.2.Foco
2.2.1.Estruturação
2.2.2.GerenciamentodaComplexidade
2.2.3.Colaboração
2.2.4.Agilidade
2.2.5.Qualidade2.3.ParaoCientistadeDados
2.3.1.Academia:Pesquise,Publique,Próximo.
2.3.1.1.Resultado:nenhumincentivoemrelaçãoàqualidadedecódigo
2.3.1.2.Exemplo
2.3.1.2.1.karpathy/char-rnn
Link:https://github.com/karpathy/char-rnn/blob/master/train.lua
2.3.2.Endereçandodeficiências
2.3.2.1.EstruturaçãodeCódigo
2.3.2.2.TestesUnitários/Funcionais
2.3.2.3.MetodologiasÁgeis
2.3.2.4.VersionamentodeCódigo
2.3.2.5.AlgoritmoseEstruturasdeDados(alémdeCiênciadeDados)
2.3.2.6.TrabalhoemEquipe
3.SobreMim3.1.BacharelemCiênciadaComputação3.2.Mestrado/Doutorado3.3.Cercade20anosdeexperiênciademercado.
3.3.1.JavaSE/EE
3.3.2.Web(PHP/ASP.NET/Ruby)
3.3.3.Cloud3.4.PrimeiroprojetocomRedesNeuraisem20123.5.2013:ZunnitTechnologies
3.5.1.Desafioinicial:performanceeconfiabilidade.
3.5.2.DesafiosdeCiênciadeDados:-SistemasdeRecomendação-AprendizadodeMáquinacorporativo.
3.6.2016:Zunnit->Kunumi
3.6.1.Estruturaçãodaequipetécnica
3.6.2.DezenasdeprojetosutilizandoAprendizadodeMáquinaem
clientescorporativos.
3.6.3.Algunsprojetosacadêmicose"culturallandmarks"
3.6.3.1.RZOeSabotage-NEURAL(AudioOficial)Part.NegraLieFamiliaSabotage-Prod.DJCIA
Link:https://www.youtube.com/watch?v=edhZKOO2Dhg&feature=youtu.be&t=71
Video:http://www.youtube.com/embed/edhZKOO2Dhg?start=71