Agora que você já está contextualizado com o cenário dos dados, responda: Onde você gera dados no seu dia a dia?
Uma vez compreendidos os mais diversos cenários de dados, conceitue a diferença entre dados estruturados, semiestruturados e não estruturados.
Qual é a diferença entre dado, informação e conhecimento?
Quem foram os principais nomes da história dos dados e quais as contribuições deles?
O que é um Data Warehouse e Data Warehousing?
Quais são as expectativas para o futuro dos estudos que envolvem Data Warehouse no futuro?
Qual é a diferença entre o modelo relacional e o modelo multidimensional?
O que é ETL? Por que o processo de extração, transformação e carga é tão importante para o processo de Data Warehousing?
O que é um cubo de dados?
Qual é a principal diferença entre OLAP e OLTP?
1. Resposta Esperada: O acadêmico deve responder coisas de seu cotidiano, como: sistemas de informação, redes sociais.
2. Resposta Esperada: Dados estruturados são aqueles que precisam de uma estrutura definida antes da inserção dos dados, os dados semiestruturados têm uma estrutura que vai mudando conforme as inserções dos dados e os dados não estruturados não têm uma estrutura, necessitando de uma computação para extrair informação.
3. Resposta Esperada: Dados são códigos que constituem a matéria-prima da informação, ou seja, é a informação não tratada que ainda não apresenta relevância. Eles representam um ou mais significados de um sistema. A informação é qualquer estrutura ou organização desses dados e, por fim, o conhecimento é a capacidade que o processamento da informação adicionado ao repertório individual nos dá de agir e prever o resultado dessa ação.
4. Resposta Esperada: Edd Codd com a invenção do modelo relacional, Bill Inmon e Ralph Kimball com a criação e evolução do conceito de Data Warehouse e Usama Fayad com conceitos sobre Data Mining.
5. Resposta Esperada: Definido de várias maneiras diferentes, mas não de uma forma rigorosa. Um Data Warehouse é um banco de dados analítico para suporte a decisão que é mantida separadamente da base operacional da organização. Esta base de dados suporta processamento de informação fornecendo uma plataforma sólida para análise de dados históricos, consolidados e limpos. Já, segundo Inmon, o processo de Data Warehousing é o processo de construir e usar data warehouses.
6. Resposta Esperada: Aqui é esperado que o aluno discorra sobre ao menos uma das tendências descritas no texto que aborda as principais tendências que têm como fonte: 12 principais ferramentas de Business Intelligence em 2019.
7. Resposta Esperada: Um banco de dados multidimensional (BD multidimensional) geralmente armazena um volume muito maior de dados, visto que há alta redundância. Ao contrário do BD relacional, em que cada registro tem individualmente grande importância, no banco de dados multidimensional os registros costumam não ter muita importância isoladamente e sim no seu todo. Neste processo, agentes de nível estratégico das organizações buscam em seus bancos de dados informações úteis, que passaram despercebidas pelos ângulos de visão convencionais e que podem auxiliar na tomada de decisões sobre o futuro dos negócios.
8. Resposta Esperada: Segundo a literatura, cerca de 80% de todo esforço é realizada na construção da etapa de ETL. Esta etapa é importante porque é responsável por coletar e integrar os dados, que muitas vezes são oriundos de diversas fontes. Posteriormente, na etapa de coleta, os dados são transformados e toda preparação para compreensão de tais dados são realizadas aqui. Quando armazenados no modelo multidimensional, os dados já estarão preparados e limpos, podendo apenas ser utilizados.
9. Resposta Esperada: Um cubo de dados é uma metáfora visual para análise multidimensional dos dados armazenados em um Data Warehouse. Supondo que um modelo multidimensional seja composto por três dimensões, assim formaria o cubo. A metáfora representa o fato de o usuário poder pegar tais dados em mãos e analisá-los por diversas perspectivas.
10. Resposta Esperada: Uma vez que OLAP significa (online analytical processing, processo analítico on-line) e OLTP (online transaction processing, processo de transação on-line) fica claro que a diferença é que um é um servidor de análise e outro um servidor para transações. No entanto, a principal diferença parte da maneira com que os dados são modelados, no caso da transação, o objetivo é garantir a integridade, sendo que no processo de modelagem em cada etapa se deve garantir a integridade dos dados, via formas normais, criando um maior número de tabelas. Já o OLAP, tem como objetivo otimizar as análises, os dados quando chegam a esses sistemas já têm sua integridade garantida, seja pelos seus sistemas OLTP de origem, seja pela etapa de ETL, cabendo à modelagem desses sistemas focar em criar o mínimo de tabelas possíveis o que implicará consultas mais rápidas.