Hudsola (discussão | contribs)
Hudsola (discussão | contribs)
Linha 37: Linha 37:
<br>
<br>


= Exemplo de resultado tangível =.
= Exemplo de resultado tangível =
Uma empresa tem muitos fornecedores e baseado em dados, (geografia, característica do cliente, do fornecedor, etc) dos últimos 4 anos e através desse conjunto de variáveis e um modelo aplicado, definiram qual fornecedor é o que menos atrasaria uma entrega em determinada situação.
Uma empresa tem muitos fornecedores e baseado em dados, (geografia, característica do cliente, do fornecedor, etc) dos últimos 4 anos e através desse conjunto de variáveis e um modelo aplicado, definiram qual fornecedor é o que menos atrasaria uma entrega em determinada situação.
<br>
<br>

Edição das 18h39min de 21 de outubro de 2021

Evolução na profissão

Tiago Kerr, 26 anos, foi um estudante de Estatística na UFU antes de se tornar um Cientista de Dados. Através de pesquisas de estatísticas de dados que conheceram a Ciência de dados. teve iniciação cientifica em estatística multivariaveis que é muito similar a Machine Learning, o que lhe deu acesso aos principais algoritmos. Após a iniciação cientifica, começou a prestar consultoria para pós graduação e sempre utilizando algoritmos de Ciência de dados. Com essa experiência, passou por diversas empresas até chegar nos dias de hoje onde atua aplicando Ciência de dados em redes sociais pela Brivia.

Descrição da atividade atual

A empresa trás uma certa demanda e o Cientista de Dados é responsável por, através de analise do banco de dados, identificar o que é mais e menos relevante/impactante para tal demanda, ou seja, transformar dados em informação de valor para a empresa. Através de metodologia chamada CRISP-DM que é: Business Understanding > Data Understanding > Data Preparation > Modeling > Evaluation > Deployment > DATA. (Sempre acompanhado de especialistas de determinada área)

Requisitos mínimos para exercer a profissão

Data Scientist (cientista de dados) é abordada em graduação de Ciência da Computação, Estatística, Sistemas de Informação e outros derivados da Tecnologia. E também, existem diversos cursos e livros sobre Ciência de dados que ensinam algoritmos que podem ser utilizados, porém existe diversos algoritmos e diversas situações que requer certo tipo de algoritmo. Recomenda-se conhecer mais sobre Data Science, desenvolver habilidades de programação (se especializar em uma linguagem primeiro), aprofundar em conceitos básicos de estatística/matemática, aprender a usar a linguagem de programação para manipulação de dados, fazer analises exploratórias e descritivas (como gráficos e relatórios), aprender sobre o conceito de aprendizado da maquina e ver modelos e algoritmos, aprender linguagem de banco de dados e por fim desenvolver o primeiro projeto.

Ferramentas usadas no dia-a-dia

Usa-se bastante ferramentas para divresas funções como Data Plataform & Ingestion Tools (Spark), Development Tools (Visual Studio), Linguagem de Programação (Java, R, Python), Deep Learning Tools (Open Neural Network Exchange), ML & AI Tools ( Microsoft ML), Data Exploration & Visualization (SQL server).

Tecnologias envolvidas

Conhecimento técnico e científico aplicado na atividade profissional utilizando ferramentas, processos e recursos físicos. Neste caso, escolher uma tecnologia e aprofundar a ponto de poder discutir em sala de aula Exemplos:

  • SO, Banco de Dados, Linguagens, Metodologia ágil para o Engenheiro de Software
  • Redes de Computadores, Roteamento, sistemas de comunicação e comutação para o Analista de Redes
  • Criptografia, Certificação Digital, Banco de Dados, Ambiente Web para Analistas de Segurança
  • Banco de Dados, Normalização, Tuning, redundância para o DBA
  • E assim por diante ....


Pesquisar
Deep Learning

Ética profissional

- Apontar qualquer situação em que é necessário ética. Seja alguma situação vivida pelo profissional ou que ele tenha tido conhecimento. Importante ressaltar o comportamento adequado do profissional dentro de uma empresa ou de um negócio. - Caso o profissional não sugira nada, a equipe deverá pesquisar e discutir algum caso - Os casos, tanto podem tratar de comportamentos éticos positivos quanto de situações onde a ética tenha sido desvirtuada.

Exemplo de resultado tangível

Uma empresa tem muitos fornecedores e baseado em dados, (geografia, característica do cliente, do fornecedor, etc) dos últimos 4 anos e através desse conjunto de variáveis e um modelo aplicado, definiram qual fornecedor é o que menos atrasaria uma entrega em determinada situação.

Upload da apresentação

https://www.youtube.com/watch?v=VwfY-5Zw9FY


Dúvidas


  • 01. [Luiz Cláudio] O que são Dashboards? Para que servem? Cite um exemplo de Tomada de Decisão baseado num deles


  • 02. [Luiz Cláudio] Como funciona o ETL? Dê um exemplo de utilização prático.


  • 03. [Luiz Cláudio] O que é DataLake?


  • 04. [Luiz Cláudio] Qual a vantagem da empresa em usar um BigData?


  • 05. [Luiz Cláudio] O que é uma Análise Exploratória?


  • 06. [Luiz Cláudio] Explique Clusterização e sua função nos desafios de uma atividade de Ciênciade Dados.


  • 07. [Luiz Cláudio] Qual a competência (responsabilidade) de um Engenheiro de Dados?


  • 08. [Luiz Cláudio] Cite alguns algoritmos considerados como básicos para o iniciante.


  • 09. [Luiz Cláudio] Vocês lidam com Banco de Dados NoSQL? Qual ou quais?


  • 10. [Davy Bittencourt Lima] Vcs tem algum papel em casos de vazamentos de dados?