Evolução na profissão

  • Curso de informática básica (word, excel, power point) - ICASU
  • Curso de montagem manutenção e configuração de

computadores e redes - PRODUTEC

  • Curso técnico em informática - Escola Agrotécnica - IFTM
  • Sistemas de Informação - UNIUBE
  • Estágio em desenvolvimento Delphi - Sankya
  • Ciência da Computação - UFU
  • Estágio em manutenção de computadores - UFU
  • Curso técnico em música - Conservatório Estadual
  • Iniciação científica - UFU - Marcelo Maia
  • Estágio em desenvolvimento web PHP - UFU
  • Mestrado em mineração de dados aplicada à engenharia de software - UFU - Marcelo Maia
  • Analista de BI (Business Intelligence) Junior - Algar Telecom
  • Analista de Dados DW (Data Warehouse)
  • Analista de DBM (Data Base Marketing)
  • Cientista de Dados
  • Engenheiro de Dados
  • Líder Cientista de Dados Pleno
  • ChatBot Designer
  • Agile Coach


Descrição da atividade atual

  • Analista de Dados
  • Engenheiro de Dados
  • Cientista de Dados


Requisitos mínimos para exercer a profissão

Conhecimentos:

  • Inglês
  • Lógica
  • Estrutura de Dados: Lista, Matriz, Tabelas
  • Teoria de Conjuntos: Interseção, União
  • Estatística descritiva e probabilidade: Comparação de percentuais,

frequência, probabilidade, confiança.

  • Conhecimento do negócio e do problema a ser resolvido

Habilidades:

  • SQL
  • Programação: Python, R, Knime
  • Modelagem de dados em bancos relacionais: DER(Diagrama Entidade e

Relacionamento)

  • Plotagem de gráficos e dashboards: Spotifre, Tableau, Qlik, Google Data

Studio

Atitudes:

  • Autodidata: Ler documentação de API, Bancos de Dados e Ferramentas.
  • Pensamento crítico: Fazer as perguntas certas com base nos dados.
  • Criatividade: Propor novos métodos para resolver os problemas de análise.
  • Perseverança: Não desistir no primeiro modelo.
  • Colaboração: Compartilhar resultados, positivos e negativos.
  • Documentação: Documentar processos de ETL e Modelagem.



Ferramentas usadas no dia-a-dia

  • Knime
  • Google Data Studio
  • Jupyter
  • Linguagens de programação : Python , R
  • SQL


Tecnologias envolvidas

  • Big Data
  • Cloud
  • Iot


Ética profissional

  • Segurança da Informação.
  • Não forçar resultados.
  • Transparências nos métodos de análise.
  • Admitir e aprender com os seus erros e de terceiros


Exemplo de resultado tangível

Recomendação de produtos para empresas : SmartFiPro

Upload da apresentação

https://drive.google.com/open?id=1Fjm_fIbpl-f_zPWl3lqvpyaQqnSMlMm5

Dúvidas


  • 01. O que é BigData?
    • É um termo que descreve o enorme volume de dados que sobrecarrega as empresas diariamente e que precisam ser processador e armazenados.


  • 02. O que são Dashboards? Para que servem? Cite um exemplo de Tomada de Decisão baseado num deles.
    • Dashboards são painéis feitos por um cientista ou analista de dados utilizados para apresentar os resultados da coleta, limpeza, transformação e análise de dados ao cliente. É muito comum utilizar gráficos nas dashboards pois facilita o entendimento do resultado apresentado. Existem vários tipos de dashboards, todos com suas características específicas e um cientista de dados pode escolher entre um Dashboard Analítico, que permitem que as empresas tenham uma visão granular de seus dados para descobrir padrões e tendências específicas, e um Dashboard Estratégico, que gerenciam atividades de nível superior, mostrando informações importantes sobre o desempenho geral de um negócio e oportunidades.


  • 03. Qual a característica da Linguagem R? É procedimental, lógica, funcional? Mais interessante que o Python?
    • o R também apresenta uma série de recursos para plotagem de gráficos, como personalização de: cor, tipo e tamanho de letra, símbolos, títulos e subtítulos, pontos, linhas, legendas, planos de fundo e muito mais. É uma linguagem orientada a objeto. R e Python são duas tecnologias interessantes, é difícil determinar qual é mais interessante visto que ambas possuem características úteis para determinados problemas.


  • 04. O que faz o Analista de DBM?
    • Realiza a gestão do DBM da companhia junto ao fornecedor contratado, acompanhando de perto as melhorias e as alterações. Entende as regras de negócio da empresa e replica os conhecimentos na estrutura do DBM (Database Marketing). Implementa e acompanha métricas de negócios e realizar melhorias nas bases de dados e nos processos da área de DBM. Atua com a criação e gestão de mailings extraídos da base para suporte nas ações mercadológicas. Elabora apresentações sobre conclusões das análises descritivas.


  • 05. Qual a diferença entre DataWarehouse e Data Mining?
    • DataWarehouse é uma coleção de dados, orientados por assunto, integrados, variáveis com o tempo e não voláteis, para dar suporte ao processo de tomada de decisão. Data Mining é um conjunto de técnicas de estatística e inteligência artificial aplicadas à análise de grandes volumes de dados, para dar subsídio nas tomadas de decisão.


  • 06. Como funciona o ETL? Dê um exemplo de utilização prática.
    • ETL: Extract, Transform, Load. É o processo de extrair dados de diversas fontes transformando os no formato necessário para gravar em uma base de destino que poderá ser usada para gerar relatórios e análises preditivas.
      • Extract : Extrair dados de sistemas da empresa: Vendas, Estoque, Financeiro.
      • Transform: Transformar os tipos de dados dos sistemas, padronizando os tipos de colunas nas tabelas.
      • Load: Inserir os dados transformados nas tabelas do banco de destino: DW - Data Warehouse


  • 07. Para que serve um ChatBot?
    • Um ChatBot serve pra sanar dúvidas comuns entre os usúarios de algum site e podem evoluir conforme mais dúvidas vão aparecendo, utilizando machine learning.


  • 08. O que é DataLake?
    • DataLake é basicamente um repositório de armazenamento dos dados conhecidos como "BigData". Eles são depositados ali ainda em estado bruto, sem o processamento e análise e até mesmo sem uma governança. A ideia é manter na organização dados que podem ser estrategicamente úteis, mesmo que eles, na realidade, não sejam requeridos em nenhum momento posterior. O data lake seria o local de armazenamento dessas informações.


  • 09. O que significa "Ser Ágil"?
    • Ser ágil significa realizar entregas de valor para o cliente de forma organizada e com qualidade.