Đây là vấn đề then chốt để phát huy sức mạnh của Excel. Tổ chức cơ sở dữ liệu trong Excel là vấn đề thoạt nhìn rất đơn giản nhưng thật ra không phải, nó đòi hỏi người dùng phải có tư duy logic tốt và tầm nhìn xa, thấy được cái gì có thể xảy ra trong tương lai. Thấy được những thông tin nào cần có trong tương lai và sẽ lấy những thông tin này như thế nào.
Người dùng thường lầm lẫn giữa cơ sở dữ liệu với các báo cáo cần cung cấp, một báo cáo chỉ cần một số thông tin nhất định và nó được trình bày sao cho người đọc dễ hiểu và rõ ràng, có thể có rất nhiều báo cáo. Còn CSDL thì bao gồm đầy đủ tất cả thông tin của đối tượng nào đó và nó có thể được mở rộng khi có thêm thông tin mới xuất hiện.
Cơ sở dữ liệu phải đảm bảo các nguyên tắc sau:
Dòng đầu tiên của CSDL là tên của các cột (trường/Fields), mỗi cột đều có tên và tên không trùng nhau.
Các dòng tiếp theo gọi là các mẫu tin (records), mỗi mẫu tin là tất cả các thông tin có liên quan đến một đối tượng nào đó.
Thông tin trên từng cột phải mang tính thống nhất về kiểu dữ liệu, tức chỉ có thể là text hoặc number không thể có cả hai. Nên thiết lập kiểu dữ liệu ngay từ đầu trước khi nhập liệu.
Trong CSDL không có bất kỳ một dòng trống hay một dòng tổng nào.
Các thông tin mang tính chất ít biến động như tên khách hàng, tên hàng hóa, tên tài khoản, tên hãng tàu, tên kho…chúng ta nên tổ chức riêng thành các CSDL phụ, nhưng vẫn phải đảm bảo các nguyên tắc trên. Các CSDL phụ phải bảo đảm có tối thiểu ít nhất 2 cột (trường/Field), một cột là mã (code) còn cột còn lại là tên nếu cần thêm thông tin thì thêm cột.
Cơ sở dữ liệu chính phải đảm bảo chứa đầy đủ các thông tin cần truy xuất sau này cho tất cả các báo cáo có thể được lập. Chỉ cần chúng ta tổ chức tốt phần CSDL như yêu cầu ở trên thì chúng ta có vô vàn báo cáo một cách dễ dàng bằng cách kết hợp các hàm (functions) và các công cụ (tools) của Excel.