Quando estamos trabalhando no computador, gerando, copiando, alterando e baixando da internet arquivos e dados, estamos fazendo essas ações por meio de arquivos de dados, pastas ou banco de dados? Esta lição te levará a identificar alguns aspectos relativos à diferenciação e à organização de informações, para que elas sejam armazenadas e utilizadas de forma racional e efetiva. Assim, serão exibidas as diferenças entre dados e banco de dados, e em qual cenário utilizar um ou outro.
Sempre que olhamos algumas informações organizadas em tabelas ou em planilhas eletrônicas, percebemos que os dados e as informações estão dispostos em quadros. Em outras palavras, em um plano cartesiano. Um plano cartesiano pode ser definido como um plano formado pela interseção de dois eixos coordenados e perpendiculares entre si, ou seja, que formam um ângulo de 90 graus. O eixo horizontal é chamado de eixo x e o eixo vertical é o eixo y. Esses eixos se cruzam na origem, cuja localização é dada por (0, 0). Por exemplo, no Excel, temos as colunas formadas por letras e as linhas formadas por números. Por isso, podemos identificar o que está armazenado, por exemplo, na coordenada L23, ou seja, na coluna L e na linha 23, onde terá uma célula com algum dado. As planilhas, geralmente, são compostas por números, podendo ser moeda, percentual, medida, data, hora ou minuto, por exemplo. Entretanto, é possível existir palavras também.
Isso pode nos levar a crer que um orçamento, por exemplo, que é formado por quadros de gastos, custos, recebimentos e pagamentos, por exemplo, pode ser elaborado em uma planilha do Excel. Ele pode! Entretanto, depende de uma quantidade enorme de variáveis. Por exemplo, quantas pessoas atuarão extraindo e inserindo dados? Qual será a quantidade de variáveis? Qual é o tamanho da organização?
Eu digo que um orçamento efetuado em Excel pode servir de ensaio para uma pequena empresa ou para um orçamento pessoal ou familiar. O meu orçamento pessoal, por exemplo, não é feito em Excel, mas em um aplicativo na Nuvem que usa o que é adequado: o banco de dados.
Identificar as diferenças entre um banco de dados e uma planilha é extremamente importante para gerenciar os dados da empresa de forma eficaz. Além disso, entender as principais características é essencial para otimizar as capacidades.
Muitas pessoas costumam confundir bancos de dados com planilhas. Possivelmente, porque ambos são usados para armazenar e gerenciar conjuntos de dados. No entanto, a diferença fundamental é a maneira como eles armazenam e manipulam esses dados. É isso o que exploraremos nesta lição.
Há 20 anos, momento em que a disponibilidade da internet era extremamente baixa em relação à hoje, principalmente quando pensamos nas tecnologias móveis e nas redes 3G, 4G e, mais recentemente, 5G, eu utilizava um programa de gestão financeira pessoal. Era no modelo em que comprávamos o programa. A instalação ocorria por meio de um CD ou de um DVD sem nenhuma conexão com a internet. O máximo que acontecia era o envio de um e-mail de suporte para entrarmos em contato.
Era um programa excelente. Utilizei ele por mais de quatro anos, quando, um dia, quando fui atualizar os pagamentos que tinha efetuado na semana, ele informou que não era possível fazer essa ação pelo fato de ter algum problema no carregamento dos dados. A primeira coisa a fazer foi acessar e tentar abrir o arquivo de backup. O próprio programa permite realizar essas cópias de segurança, inclusive, escolhendo onde gravar o arquivo de backup. Ao tentar fazer isso, a mesma mensagem foi enviada e o programa não abriu.
Enviei por e-mail o arquivo para a empresa desenvolvedora. Ela informou que o arquivo havia sido corrompido e pediu para que eu utilizasse o arquivo de backup. Retornei informando que já havia efetuado essa ação e que o resultado foi o mesmo, ou seja, o programa não abria. O retorno que tive é que, provavelmente, fiz o backup, que é nada mais que uma cópia do arquivo original já corrompido, e não era possível efetuar a recuperação. Até hoje, lembro-me da frustração que tive. Depois, fui entender melhor a diferença entre os programas que utilizam o arquivo de dados e o banco de dados. Minha percepção foi a de que o software foi criado com uma estrutura fragilizada. Por isso, você entenderá um pouco mais as diferenças e saberá utilizar a estrutura certa nas suas atividades.
O sistema de arquivos é basicamente uma forma de organizar os arquivos em um meio de armazenamento, como um disco rígido, SSDs e pen drive. O sistema de arquivos organiza os arquivos e auxilia na recuperação dos arquivos, quando necessário. Segundo Peterson (2022), os sistemas de arquivos consistem em diferentes arquivos que são agrupados em diretórios ou pastas. Abrangem diferentes tipos de arquivos, tais como mp3, mp4, txt e doc.
Peterson (2022) também afirma que os diretórios contêm outras pastas e arquivos. Por exemplo, é possível criar uma pasta no computador com qualquer nome e colocar arquivos dentro dessa pasta. Também é possível criar uma pasta dentro de outra. Você pode, por exemplo, criar uma pasta no computador com o nome “Escola”. Dentro da pasta “Escola”, você pode criar outra pasta chamada “1º ano”. Dentro da pasta “1º ano”, pode criar mais uma pasta chamada “Matemática”. Nessa pasta, você pode colocar todo o seu material de estudos, trabalhos e materiais de consulta. Além disso, pode abrir dentro da pasta “Matemática” mais quatro pastas, sendo: “1º bimestre”, “2º bimestre”, “3º bimestre” e “4º bimestre”. É possível ter uma pasta apenas para músicas e subpastas para cada banda ou artista. Uma pasta para fotos e subpastas para cada mês, ano ou por evento. Uma pasta para planilhas e projetos. A organização fica a seu critério. O importante é saber a lógica de como encontrar o arquivo quando precisar.
Peterson (2022) esclarece que o sistema de arquivos realiza operações básicas, como gerenciamento, nomeação de arquivos e regras de acesso. Um sistema de arquivos permite que você lide com a maneira de ler e gravar dados no meio de armazenamento. Ele é instalado diretamente no computador com os sistemas operacionais, como Windows e Linux.
Mesmo um arquivo organizado cartesianamente, assim como foi descrito, em um plano geralmente conhecido como planilha, tabela ou quadro, é um arquivo de dados. Isso não significa que os arquivos do Word, as músicas e as fotos não tenham dados, mas uma planilha, por assim ser, é um arquivo de dados ou um banco de dados?
Uma planilha armazena valores de dados em células, que são organizadas em linhas e colunas. Essas células podem interagir umas com as outras. Por exemplo, você pode ter uma célula realizando o processamento em relação a outros valores de célula. Por exemplo, a célula B10 pode ser somada com a B22 e o resultado pode ser apresentado na célula B15. No entanto, um arquivo, mesmo de uma planilha eletrônica, não é um banco de dados.
Por outro lado, um banco de dados armazena os dados em tabelas compostas por uma ou mais colunas e linhas. Referimo-nos a cada linha de dados como um registro. Várias tabelas podem compor um esquema de banco de dados relacional, que é como um banco de dados organiza os dados relacionados. Por exemplo, um banco de dados pode ter milhares de arquivos do Excel, do Word, de música, fotos e vídeos. Um banco de dados pode ter, dentro dele, outros bancos de dados. Contudo, você pode pensar: no Word e no PowerPoint, também posso ter fotos, vídeos ou tabelas.
Sim, você pode, mas eles não são organizados e não podem ser relacionados. Não há um endereço que pode ser localizado por algum comando ou utilizado por um programa ou por vários programas e vários usuários simultaneamente.
Segundo Elmasri e Navathe (2011), fundamentalmente, um banco de dados é um programa de computador projetado para armazenar, manipular e recuperar informações. Ele é instalado nos computadores, especialmente em computadores servidores, ou seja, que fornecem acesso simultâneo a muitas pessoas conectadas a uma rede ou a internet. Geralmente, quando navegamos na internet, ao acessarmos uma homepage, estamos acessando, embora não diretamente, o banco de dados dos servidores. Os bancos de dados usam tabelas como um meio de armazenar e recuperar as informações. As tabelas são organizadas com colunas (campos) e linhas (registros). Essa estrutura tabular é semelhante às planilhas, mas, ao contrário de uma planilha, a maioria dos bancos de dados é relacional. Isso significa que os dados entre as tabelas podem ser vinculados e referenciados.
As planilhas são ótimas para valores numéricos e de texto em volume relativamente baixo. Os bancos de dados também lidam habilmente com os valores numéricos e de texto, mas podem incorporar facilmente outros tipos de informações, como imagens e documentos. Os bancos de dados também podem acomodar downloads de dados de alto volume e arquivos grandes, como os de registradores de dados, os dispositivos GPS, as câmeras, os drones e outros dispositivos de coleta.
Em um banco de dados relacional, os dados em uma tabela podem ser relacionados de acordo com chaves ou conceitos comuns. Os relacionamentos são uma conexão lógica entre diferentes tabelas e são estabelecidos com base na interação entre essas tabelas. Relacionamentos bem definidos (regras) entre tabelas de banco de dados podem ser estabelecidos para impor restrições aos dados. As tabelas comunicam e compartilham informações, o que facilita a pesquisa, a organização e a geração de relatórios de dados.
Normalmente, em uma planilha, as informações são formatadas. Portanto, adicionar novos dados pode ser tedioso. Como as tabelas dos bancos de dados armazenam os dados brutos sem formatação, a entrada de dados é mais fácil. Muitos bancos de dados têm formulários ou interfaces de usuário projetadas para facilitar a entrada e a edição de dados. Mecanismos para recuperar dados facilmente também estão geralmente disponíveis para o usuário do banco de dados. Os dados podem ser classificados com base em qualquer campo e podem ser gerados relatórios contendo apenas determinados campos de cada registro sem alterar os dados de origem. Os relatórios de dados aplicam a formatação depois que os dados são extraídos do banco de dados.
Embora os dados em planilhas possam ser classificados e filtrados, um banco de dados tem ampla funcionalidade de consulta, que pode recuperar todos os registros que correspondem aos critérios selecionados, fazer referência cruzada de registros em várias tabelas e realizar cálculos agregados e complexos em várias tabelas. Dentre esses elementos, segundo Chen (1990), os bancos de dados fornecem flexibilidade para classificar e apresentar dados de maneiras que seriam quase impossíveis de serem realizadas com planilhas bidimensionais. Muitos bancos de dados também fornecem meios para automatizar a geração de consultas e relatórios usando procedimentos armazenados.
Os dados em planilhas separadas não podem ser facilmente comparados e analisados. As decisões baseadas nesses conjuntos díspares de informações podem ser falhas. De acordo com Cardoso e Cardoso (2012), quando os dados são mantidos em um banco de dados relacional e centralizado, eles são facilmente acessíveis para consultas, análises e relatórios. Como o banco de dados aplicará os mesmos padrões de qualidade para qualquer conjunto de dados, as decisões podem ser tomadas com confiança.
Os bancos de dados são projetados para consultar informações sem carregar todas as informações na memória, ao contrário das planilhas. Portanto, operam mais rapidamente que as planilhas, ao lidar com grandes conjuntos de dados. As planilhas têm limitações de memória.
De forma geral, segundo Peterson (2022):
Sistema de arquivo
Um sistema de arquivos é efetuado pelo sistema operacional do computador. Ele organiza os arquivos em um meio de armazenamento. Ele controla como os dados são armazenados e recuperados.
O sistema de arquivos fornece os detalhes da representação de dados e armazenamento de dados.
Armazenar e recuperar dados não pode ser feito de forma eficiente em um sistema de arquivos.
Não oferece processos de recuperação de dados.
O sistema de arquivos não tem um mecanismo de recuperação de falhas.
Proteger um sistema de arquivos é muito difícil.
Em um sistema de gerenciamento de arquivos, a redundância de dados é maior.
A inconsistência de dados é maior no sistema de arquivos.
O sistema de arquivos oferece menor segurança.
O sistema de arquivos permite que você armazene os dados como entidades e os arquivos de dados isolados.
Não fornece suporte para transações complicadas.
O processo de centralização é difícil no sistema gerenciamento de arquivos.
Não oferece backup e recuperação de dados em caso de perdas.
Não há processamento de consulta eficiente no sistema de arquivos.
Esses sistemas não oferecem simultaneidade.
Sistema de Gerenciamento de Banco de Dados
DBMS ou Sistema de Gerenciamento de Banco de Dados é um aplicativo de software. Ele é usado para acessar, criar e gerenciar bancos de dados.
O DBMS fornece uma visão abstrata dos dados que oculta os detalhes.
O DBMS é eficiente de usar, pois há uma grande variedade de métodos para armazenar e recuperar dados.
Há uma recuperação de backup para dados no DBMS.
O DBMS fornece um mecanismo de recuperação de falhas.
O DBMS oferece um bom mecanismo de proteção.
A redundância de dados é baixa no sistema DBMS.
A inconsistência de dados é baixa em um sistema de gerenciamento de banco de dados.
O DBMS oferece alta segurança.
O Sistema de Gerenciamento de Banco de Dados armazena dados, restrições e inter-relações definidas.
Fácil de implementar transações complicadas.
A centralização é fácil de alcançar no sistema DBMS.
O sistema DBMS fornece backup e recuperação de dados, mesmo que sejam perdidos.
Você pode facilmente consultar os dados em um banco de dados usando várias linguagens. A mais conhecida é SQL.
O sistema DBMS fornece um recurso de simultaneidade.
Os bancos de dados são melhores para armazenar grandes quantidades de dados brutos por um longo período. Eles são particularmente úteis se existirem vários usuários acessando os dados ao mesmo tempo e serem necessárias atualizações constantes de dados. Os bancos de dados são poderosos o suficiente para manter a integridade dos dados enquanto são realizadas entradas e atualizações simultâneas de dados.
Um exemplo que é possível utilizar para compreender melhor é um arquivo de aluno, aqueles que geralmente as escolas têm. Uma escola pode ter milhares de registros individuais de alunos. Cada registro de aluno contém os mesmos campos. Nome do estudante, nome dos pais, endereço, histórico de desempenho (disciplinas e notas organizadas por série), registro de presença, documentos digitalizados (foto, certidão de nascimento, comprovante de endereço, comprovantes de vacina etc.) e dados dos documentos digitalizados, como número de CPF e certidão de nascimento. Em outras palavras, muitas informações que podem ser acessadas remotamente e por várias pessoas simultaneamente.
Acredito que você entendeu o cenário! A organização das informações não é, na verdade, “um arquivo de aluno”. É possível pedir para que o software que faz a gestão dessas informações gere:
Um arquivo em PDF dos dados relacionados, ou seja, informações de um ou de outro estudante.
Um arquivo do Excel com a relação dos estudantes da Escola X, série Y, bimestre 1 da disciplina H.
Um arquivo em Excel ou em PDF com a relação dos estudantes, incluindo foto, nome e número de documento ao lado para coletar assinaturas de presencialidade a respeito de um evento que ocorrerá na escola.
O que temos é um software (sistema de registro de estudantes da escola) e um banco de dados, que é outro software em que constam várias informações. Ele permite que, ao mesmo tempo, alguém o consulte e outro o alimente, inserindo as notas de uma prova que ocorreu na semana passada, por exemplo, para que os dados possam ser relacionados e geradas várias informações. Nesse caso, um arquivo de dados não é suficiente para atender a essas necessidades.
Você pode estar preocupado(a), uma vez que um arquivo de dados pode corromper e você pode perder o que tem naquela planilha eletrônica com 20 mil linhas e 50 colunas. Há uma solução para isso! Utilize planilhas on-line, como Excel on-line e Google Planilhas. Nesse caso, os seus dados são gravados em servidores da internet que utilizam banco de dados que dificilmente corrompem. O rompimento de um arquivo pode ocorrer por muitos motivos, certamente, problemas relacionados ao seu computador. Logo, se estão na Nuvem, as chances de isso ocorrer são muito menores. Cada campo, no entanto, contém dados diferentes.
CARDOSO, V.; CARDOSO, G. Sistema de banco de dados: uma abordagem introdutória e aplicada. São Paulo: Saraiva, 2012.
CHEN, P. Gerenciando banco de dados: a abordagem entidade-relacionamento para projeto lógico. São Paulo: McGraw-Hill, 1990.
ELMASRI, R.; NAVATHE, S. B. Sistemas de banco de dados. 6. ed. São Paulo: Pearson Addison Wesley, 2011.
PETERSON, R. File System vs DBMS: Key Differences. Guru99, 7 maio 2022. Disponível em: https://www.guru99.com/difference-between-file-system-and-dbms.html. Acesso em: 11 jul. 2022.