Sem resumo de edição
P4blu (discussão | contribs)
Linha 36: Linha 36:
** Publicação na Wiki nos seguintes links:
** Publicação na Wiki nos seguintes links:
*** a ser criado
*** a ser criado
== Data mining ==
Data mining é uma expressão inglesa ligada à informática cuja tradução é mineração de dados. Consiste em uma funcionalidade que agrega e organiza dados, encontrando neles padrões, associações, mudanças e anomalias relevantes.
O data mining pode ser divido em algumas etapas básicas que são: exploração, construção de modelo, definição de padrão e validação e verificação.
A mineração de dados é uma prática relativamente recente no mundo da computação, e utiliza técnicas de recuperação de informação, inteligência artificial, reconhecimento de padrões e de estatística para procurar correlações entre diferentes dados que permitam adquirir um conhecimento benéfico para uma empresa ou indivíduo. Para uma empresa, o data mining pode ser uma importante ferramenta que potencia a inovação e lucratividade.
A utilização da mineração de dados é bastante usual em grandes bases de dados, e o resultado final da sua utilização pode ser exibido através de regras, hipóteses, árvores de decisão, dendrogramas, etc.
Uma mineração de dados bem executada deve cumprir tarefas como: detecção de anomalias, aprendizagem da regra de associação (modelo de dependência), clustering (agrupamento), classificação, regressão e sumarização. O processo de data mining costuma ocorrer utilizando dados contidos dentro do data warehouse.
Existem várias empresas e softwares que se dedicam à mineração de dados, pois a identificação de padrões em bancos de dados é cada vez mais importante. No entanto, a identificação de padrões relevantes não é exclusivo do mundo informático. O cérebro humano, utiliza um processo semelhante para identificar padrões e adquirir conhecimento.
Nos últimos anos, a mineração de dados tem sido amplamente utilizada nas áreas da ciência e engenharia, tais como bioinformática, genética, medicina, educação e engenharia elétrica.
O conceito de data mining é muitas vezes associado à extração de informação relativa ao comportamento de pessoas. Por esse motivo, em algumas situações, a mineração de dados levanta aspectos legais e questões relativas à privacidade e ética. Apesar disso, muitas pessoas afirmam que a mineração de dados é eticamente neutra, pois não apresenta implicações éticas.
Exemplos reais de Data Mining
A mineração de dados é muitas vezes usada por empresas e organizações para a obtenção de conhecimento a respeito de utilizadores / funcionários / clientes. Por exemplo, no setor público é possível fazer o cruzamento de dados entre o estado civil de um funcionário e o salário que ele ganha, para verificar se isso tem influência na sua vida conjugal.
Empresas como cadeias de supermercados podem recorrer a esse cruzamento de dados para determinarem produtos que são comprados em conjunto. Se um cliente que compra o produto X também compra o produto Y, talvez seja uma boa ideia posicionar os dois produtos perto, para facilitar a compra por parte do cliente.
== Data Warehouse ==
Data warehouse é um depósito de dados digitais que serve para armazenar informações detalhadas relativamente a uma empresa, criando e organizando relatórios através de históricos que são depois usados pela empresa para ajudar a tomar decisões importantes com base nos fatos apresentados.
O data warehouse serve para recolher informações de uma empresa para que essa possa controlar melhor um determinado processo, disponibilizando uma maior flexibilidade nas pesquisas e nas informações que necessitam.
Para além de manter um histórico de informações, o Data Warehouse cria padrões melhorando os dados analisados de todos os sistemas, corrigindo os erros e restruturando os dados sem afetar o sistema de operação, apresentando somente um modelo final e organizado para a análise.
Data warehouse e data mart
Um data mart é uma subdivisão ou subconjunto de um data warehouse. Os data marts são como pequenas fatias de data warehouse, que armazenam subconjuntos de dados.
Normalmente o data mart é direcionado para uma linha de negócios ou equipe, sendo que a sua informação costuma pertencer a um único departamento.
Vantagens e desvantagens do data warehouse
Algumas das principais vantagens do data warehouse são:
Inconsistências são identificadas e solucionadas antes dos dados serem carregados, o que facilita a execução da análise e de relatórios;
Contribuem para o processo de tomar decisões, através de relatórios de tendências, de exceção e relatórios que revelam os objetivos versus desempenho real.
O data warehouse também tem algumas desvantagens, entre as quais:
Não são uma solução adequada para dados não-estruturados;
Podem ter custos elevados e podem ficar ultrapassados com alguma rapidez.
Data warehouse e Business intelligence
Business intelligence (inteligência empresarial em português), é o processo de recolha e tratamento de informações que apoiam a gestão de um negócio.
Normalmente, as várias vertentes de business intelligence utilizam informação recolhida em um data warehouse. Apesar disso, nem todos os data warehouses são usados no contexto de business intelligence, porque nem todos as aplicações de business intelligence exigem um data warehouse.
OLAP
OLAP (Online Analytical Processing - Processo Analítico em Tempo Real), é uma das ferramentas mais usadas para a exploração de um data warehouse. O OLAP possibilita alterar e analisar grandes quantidades de dados em várias perspectivas diferentes.
A aplicação dessa ferramenta pode ser usada pelos gestores de qualquer área e nível, disponibilizando informações e ajudando na decisão final. O uso da OLAP pode ser aplicado em funções muito distintas, algumas das mais utilizadas variam desde funções financeiras (análises, fluxos de caixa, contas, orçamentos, etc.) passando pelo marketing (análise de preço, volume de mercado) concluindo nas vendas (previsões, lucro, clientes).Data warehouse é um depósito de dados digitais que serve para armazenar informações detalhadas relativamente a uma empresa, criando e organizando relatórios através de históricos que são depois usados pela empresa para ajudar a tomar decisões importantes com base nos fatos apresentados.
O data warehouse serve para recolher informações de uma empresa para que essa possa controlar melhor um determinado processo, disponibilizando uma maior flexibilidade nas pesquisas e nas informações que necessitam.
Para além de manter um histórico de informações, o Data Warehouse cria padrões melhorando os dados analisados de todos os sistemas, corrigindo os erros e restruturando os dados sem afetar o sistema de operação, apresentando somente um modelo final e organizado para a análise.
Data warehouse e data mart
Um data mart é uma subdivisão ou subconjunto de um data warehouse. Os data marts são como pequenas fatias de data warehouse, que armazenam subconjuntos de dados.
Normalmente o data mart é direcionado para uma linha de negócios ou equipe, sendo que a sua informação costuma pertencer a um único departamento.
Vantagens e desvantagens do data warehouse
Algumas das principais vantagens do data warehouse são:
Inconsistências são identificadas e solucionadas antes dos dados serem carregados, o que facilita a execução da análise e de relatórios;
Contribuem para o processo de tomar decisões, através de relatórios de tendências, de exceção e relatórios que revelam os objetivos versus desempenho real.
O data warehouse também tem algumas desvantagens, entre as quais:
Não são uma solução adequada para dados não-estruturados;
Podem ter custos elevados e podem ficar ultrapassados com alguma rapidez.
Data warehouse e Business intelligence
Business intelligence (inteligência empresarial em português), é o processo de recolha e tratamento de informações que apoiam a gestão de um negócio.
Normalmente, as várias vertentes de business intelligence utilizam informação recolhida em um data warehouse. Apesar disso, nem todos os data warehouses são usados no contexto de business intelligence, porque nem todos as aplicações de business intelligence exigem um data warehouse.
OLAP
OLAP (Online Analytical Processing - Processo Analítico em Tempo Real), é uma das ferramentas mais usadas para a exploração de um data warehouse. O OLAP possibilita alterar e analisar grandes quantidades de dados em várias perspectivas diferentes.
A aplicação dessa ferramenta pode ser usada pelos gestores de qualquer área e nível, disponibilizando informações e ajudando na decisão final. O uso da OLAP pode ser aplicado em funções muito distintas, algumas das mais utilizadas variam desde funções financeiras (análises, fluxos de caixa, contas, orçamentos, etc.) passando pelo marketing (análise de preço, volume de mercado) concluindo nas vendas (previsões, lucro, clientes).


== Projeto de Banco de Dados - 20/02 ==
== Projeto de Banco de Dados - 20/02 ==

Edição das 23h51min de 18 de fevereiro de 2015

Trabalhos


Desenvolvimento de um SGBD - 06/02

10 pontos

  • Criação de um programa em C que implemente CRUD
    • Mostrar execução do código com as 4 funções implementadas


Pesquisas - 13/02

5 pontos

  • Discutir as seguintes situações:
  1. Descreva exemplos em que foi necessário usar Tuning em Banco de Dados ? Ligia
  2. Mostre como usar ETL em Editor de Planilhas. -> Pablo


  • Índices
    • Apresentados em 16/01.


Estado da Arte - 19/02

15 pontos

  • Pesquisa e apresentação referente aos seguintes temas:
    • Big Data
    • NoSQL -> Ligia
    • Data Mining e DW -> Pablo


  • Entrega:
    • Publicação na Wiki nos seguintes links:
      • a ser criado


Data mining

Data mining é uma expressão inglesa ligada à informática cuja tradução é mineração de dados. Consiste em uma funcionalidade que agrega e organiza dados, encontrando neles padrões, associações, mudanças e anomalias relevantes.

O data mining pode ser divido em algumas etapas básicas que são: exploração, construção de modelo, definição de padrão e validação e verificação.

A mineração de dados é uma prática relativamente recente no mundo da computação, e utiliza técnicas de recuperação de informação, inteligência artificial, reconhecimento de padrões e de estatística para procurar correlações entre diferentes dados que permitam adquirir um conhecimento benéfico para uma empresa ou indivíduo. Para uma empresa, o data mining pode ser uma importante ferramenta que potencia a inovação e lucratividade.

A utilização da mineração de dados é bastante usual em grandes bases de dados, e o resultado final da sua utilização pode ser exibido através de regras, hipóteses, árvores de decisão, dendrogramas, etc.

Uma mineração de dados bem executada deve cumprir tarefas como: detecção de anomalias, aprendizagem da regra de associação (modelo de dependência), clustering (agrupamento), classificação, regressão e sumarização. O processo de data mining costuma ocorrer utilizando dados contidos dentro do data warehouse.

Existem várias empresas e softwares que se dedicam à mineração de dados, pois a identificação de padrões em bancos de dados é cada vez mais importante. No entanto, a identificação de padrões relevantes não é exclusivo do mundo informático. O cérebro humano, utiliza um processo semelhante para identificar padrões e adquirir conhecimento.

Nos últimos anos, a mineração de dados tem sido amplamente utilizada nas áreas da ciência e engenharia, tais como bioinformática, genética, medicina, educação e engenharia elétrica.

O conceito de data mining é muitas vezes associado à extração de informação relativa ao comportamento de pessoas. Por esse motivo, em algumas situações, a mineração de dados levanta aspectos legais e questões relativas à privacidade e ética. Apesar disso, muitas pessoas afirmam que a mineração de dados é eticamente neutra, pois não apresenta implicações éticas.

Exemplos reais de Data Mining A mineração de dados é muitas vezes usada por empresas e organizações para a obtenção de conhecimento a respeito de utilizadores / funcionários / clientes. Por exemplo, no setor público é possível fazer o cruzamento de dados entre o estado civil de um funcionário e o salário que ele ganha, para verificar se isso tem influência na sua vida conjugal.

Empresas como cadeias de supermercados podem recorrer a esse cruzamento de dados para determinarem produtos que são comprados em conjunto. Se um cliente que compra o produto X também compra o produto Y, talvez seja uma boa ideia posicionar os dois produtos perto, para facilitar a compra por parte do cliente.


Data Warehouse

Data warehouse é um depósito de dados digitais que serve para armazenar informações detalhadas relativamente a uma empresa, criando e organizando relatórios através de históricos que são depois usados pela empresa para ajudar a tomar decisões importantes com base nos fatos apresentados.

O data warehouse serve para recolher informações de uma empresa para que essa possa controlar melhor um determinado processo, disponibilizando uma maior flexibilidade nas pesquisas e nas informações que necessitam.

Para além de manter um histórico de informações, o Data Warehouse cria padrões melhorando os dados analisados de todos os sistemas, corrigindo os erros e restruturando os dados sem afetar o sistema de operação, apresentando somente um modelo final e organizado para a análise.

Data warehouse e data mart Um data mart é uma subdivisão ou subconjunto de um data warehouse. Os data marts são como pequenas fatias de data warehouse, que armazenam subconjuntos de dados.

Normalmente o data mart é direcionado para uma linha de negócios ou equipe, sendo que a sua informação costuma pertencer a um único departamento.

Vantagens e desvantagens do data warehouse Algumas das principais vantagens do data warehouse são:

Inconsistências são identificadas e solucionadas antes dos dados serem carregados, o que facilita a execução da análise e de relatórios; Contribuem para o processo de tomar decisões, através de relatórios de tendências, de exceção e relatórios que revelam os objetivos versus desempenho real. O data warehouse também tem algumas desvantagens, entre as quais:

Não são uma solução adequada para dados não-estruturados; Podem ter custos elevados e podem ficar ultrapassados com alguma rapidez. Data warehouse e Business intelligence Business intelligence (inteligência empresarial em português), é o processo de recolha e tratamento de informações que apoiam a gestão de um negócio.

Normalmente, as várias vertentes de business intelligence utilizam informação recolhida em um data warehouse. Apesar disso, nem todos os data warehouses são usados no contexto de business intelligence, porque nem todos as aplicações de business intelligence exigem um data warehouse.

OLAP OLAP (Online Analytical Processing - Processo Analítico em Tempo Real), é uma das ferramentas mais usadas para a exploração de um data warehouse. O OLAP possibilita alterar e analisar grandes quantidades de dados em várias perspectivas diferentes.

A aplicação dessa ferramenta pode ser usada pelos gestores de qualquer área e nível, disponibilizando informações e ajudando na decisão final. O uso da OLAP pode ser aplicado em funções muito distintas, algumas das mais utilizadas variam desde funções financeiras (análises, fluxos de caixa, contas, orçamentos, etc.) passando pelo marketing (análise de preço, volume de mercado) concluindo nas vendas (previsões, lucro, clientes).Data warehouse é um depósito de dados digitais que serve para armazenar informações detalhadas relativamente a uma empresa, criando e organizando relatórios através de históricos que são depois usados pela empresa para ajudar a tomar decisões importantes com base nos fatos apresentados.

O data warehouse serve para recolher informações de uma empresa para que essa possa controlar melhor um determinado processo, disponibilizando uma maior flexibilidade nas pesquisas e nas informações que necessitam.

Para além de manter um histórico de informações, o Data Warehouse cria padrões melhorando os dados analisados de todos os sistemas, corrigindo os erros e restruturando os dados sem afetar o sistema de operação, apresentando somente um modelo final e organizado para a análise.

Data warehouse e data mart Um data mart é uma subdivisão ou subconjunto de um data warehouse. Os data marts são como pequenas fatias de data warehouse, que armazenam subconjuntos de dados.

Normalmente o data mart é direcionado para uma linha de negócios ou equipe, sendo que a sua informação costuma pertencer a um único departamento.

Vantagens e desvantagens do data warehouse Algumas das principais vantagens do data warehouse são:

Inconsistências são identificadas e solucionadas antes dos dados serem carregados, o que facilita a execução da análise e de relatórios; Contribuem para o processo de tomar decisões, através de relatórios de tendências, de exceção e relatórios que revelam os objetivos versus desempenho real. O data warehouse também tem algumas desvantagens, entre as quais:

Não são uma solução adequada para dados não-estruturados; Podem ter custos elevados e podem ficar ultrapassados com alguma rapidez. Data warehouse e Business intelligence Business intelligence (inteligência empresarial em português), é o processo de recolha e tratamento de informações que apoiam a gestão de um negócio.

Normalmente, as várias vertentes de business intelligence utilizam informação recolhida em um data warehouse. Apesar disso, nem todos os data warehouses são usados no contexto de business intelligence, porque nem todos as aplicações de business intelligence exigem um data warehouse.

OLAP OLAP (Online Analytical Processing - Processo Analítico em Tempo Real), é uma das ferramentas mais usadas para a exploração de um data warehouse. O OLAP possibilita alterar e analisar grandes quantidades de dados em várias perspectivas diferentes.

A aplicação dessa ferramenta pode ser usada pelos gestores de qualquer área e nível, disponibilizando informações e ajudando na decisão final. O uso da OLAP pode ser aplicado em funções muito distintas, algumas das mais utilizadas variam desde funções financeiras (análises, fluxos de caixa, contas, orçamentos, etc.) passando pelo marketing (análise de preço, volume de mercado) concluindo nas vendas (previsões, lucro, clientes).

Projeto de Banco de Dados - 20/02

20 pontos



  • Entregas:
    • Modelagem (pode feita no DIA ou no SGBD escolhido)
    • Implementação de Banco de Dados (no SGBD escolhido)


  • Opções de SGBD:
    • Postgresql
    • Oracle ou
    • MySQL