Evolução na profissão
- Curso de informática básica (word, excel, power point) - ICASU
- Curso de montagem manutenção e configuração de
computadores e redes - PRODUTEC
- Curso técnico em informática - Escola Agrotécnica - IFTM
- Sistemas de Informação - UNIUBE
- Estágio em desenvolvimento Delphi - Sankya
- Ciência da Computação - UFU
- Estágio em manutenção de computadores - UFU
- Curso técnico em música - Conservatório Estadual
- Iniciação científica - UFU - Marcelo Maia
- Estágio em desenvolvimento web PHP - UFU
- Mestrado em mineração de dados aplicada à engenharia de software - UFU - Marcelo Maia
- Analista de BI (Business Intelligence) Junior - Algar Telecom
- Analista de Dados DW (Data Warehouse)
- Analista de DBM (Data Base Marketing)
- Cientista de Dados
- Engenheiro de Dados
- Líder Cientista de Dados Pleno
- ChatBot Designer
- Agile Coach
Descrição da atividade atual
- Analista de Dados
- Engenheiro de Dados
- Cientista de Dados
Requisitos mínimos para exercer a profissão
Conhecimentos:
- Inglês
- Lógica
- Estrutura de Dados: Lista, Matriz, Tabelas
- Teoria de Conjuntos: Interseção, União
- Estatística descritiva e probabilidade: Comparação de percentuais,
frequência, probabilidade, confiança.
- Conhecimento do negócio e do problema a ser resolvido
Habilidades:
- SQL
- Programação: Python, R, Knime
- Modelagem de dados em bancos relacionais: DER(Diagrama Entidade e
Relacionamento)
- Plotagem de gráficos e dashboards: Spotifre, Tableau, Qlik, Google Data
Studio
Atitudes:
- Autodidata: Ler documentação de API, Bancos de Dados e Ferramentas.
- Pensamento crítico: Fazer as perguntas certas com base nos dados.
- Criatividade: Propor novos métodos para resolver os problemas de análise.
- Perseverança: Não desistir no primeiro modelo.
- Colaboração: Compartilhar resultados, positivos e negativos.
- Documentação: Documentar processos de ETL e Modelagem.
Ferramentas usadas no dia-a-dia
- Knime
- Google Data Studio
- Jupyter
- Linguagens de programação : Python , R
- SQL
Tecnologias envolvidas
- Big Data
- Cloud
- Iot
Ética profissional
- Segurança da Informação.
- Não forçar resultados.
- Transparências nos métodos de análise.
- Admitir e aprender com os seus erros e de terceiros
Exemplo de resultado tangível
Recomendação de produtos para empresas : SmartFiPro
Upload da apresentação
https://drive.google.com/open?id=1Fjm_fIbpl-f_zPWl3lqvpyaQqnSMlMm5
Dúvidas
- 01. O que é BigData?
- É um termo que descreve o enorme volume de dados que sobrecarrega as empresas diariamente e que precisam ser processador e armazenados.
- 02. O que são Dashboards? Para que servem? Cite um exemplo de Tomada de Decisão baseado num deles.
- Dashboards são painéis feitos por um cientista ou analista de dados utilizados para apresentar os resultados da coleta, limpeza, transformação e análise de dados ao cliente. É muito comum utilizar gráficos nas dashboards pois facilita o entendimento do resultado apresentado. Existem vários tipos de dashboards, todos com suas características específicas e um cientista de dados pode escolher entre um Dashboard Analítico, que permitem que as empresas tenham uma visão granular de seus dados para descobrir padrões e tendências específicas, e um Dashboard Estratégico, que gerenciam atividades de nível superior, mostrando informações importantes sobre o desempenho geral de um negócio e oportunidades.
- 03. Qual a característica da Linguagem R? É procedimental, lógica, funcional? Mais interessante que o Python?
- o R também apresenta uma série de recursos para plotagem de gráficos, como personalização de: cor, tipo e tamanho de letra, símbolos, títulos e subtítulos, pontos, linhas, legendas, planos de fundo e muito mais. É uma linguagem orientada a objeto. R e Python são duas tecnologias interessantes, é difícil determinar qual é mais interessante visto que ambas possuem características úteis para determinados problemas.
- 04. O que faz o Analista de DBM?
- Realiza a gestão do DBM da companhia junto ao fornecedor contratado, acompanhando de perto as melhorias e as alterações. Entende as regras de negócio da empresa e replica os conhecimentos na estrutura do DBM (Database Marketing). Implementa e acompanha métricas de negócios e realizar melhorias nas bases de dados e nos processos da área de DBM. Atua com a criação e gestão de mailings extraídos da base para suporte nas ações mercadológicas. Elabora apresentações sobre conclusões das análises descritivas.
- 05. Qual a diferença entre DataWarehouse e Data Mining?
- DataWarehouse é uma coleção de dados, orientados por assunto, integrados, variáveis com o tempo e não voláteis, para dar suporte ao processo de tomada de decisão. Data Mining é um conjunto de técnicas de estatística e inteligência artificial aplicadas à análise de grandes volumes de dados, para dar subsídio nas tomadas de decisão.
- 06. Como funciona o ETL? Dê um exemplo de utilização prática.
- ETL: Extract, Transform, Load. É o processo de extrair dados de diversas fontes transformando os no formato necessário para gravar em uma base de destino que poderá ser usada para gerar relatórios e análises preditivas.
- Extract : Extrair dados de sistemas da empresa: Vendas, Estoque, Financeiro.
- Transform: Transformar os tipos de dados dos sistemas, padronizando os tipos de colunas nas tabelas.
- Load: Inserir os dados transformados nas tabelas do banco de destino: DW - Data Warehouse
- ETL: Extract, Transform, Load. É o processo de extrair dados de diversas fontes transformando os no formato necessário para gravar em uma base de destino que poderá ser usada para gerar relatórios e análises preditivas.
- 07. Para que serve um ChatBot?
- Um ChatBot serve pra sanar dúvidas comuns entre os usúarios de algum site e podem evoluir conforme mais dúvidas vão aparecendo, utilizando machine learning.
- 08. O que é DataLake?
- DataLake é basicamente um repositório de armazenamento dos dados conhecidos como "BigData". Eles são depositados ali ainda em estado bruto, sem o processamento e análise e até mesmo sem uma governança. A ideia é manter na organização dados que podem ser estrategicamente úteis, mesmo que eles, na realidade, não sejam requeridos em nenhum momento posterior. O data lake seria o local de armazenamento dessas informações.
- 09. O que significa "Ser Ágil"?
- Ser ágil significa realizar entregas de valor para o cliente de forma organizada e com qualidade.