数据库设计的基本原则

1. 遵循三大范式（Normalization）

范式是关系型数据库设计的规范，目的是减少数据冗余和异常。

1.1 第一范式（1NF）：原子性

要求字段值具有原子性，不可再分。

反例：在"联系方式"字段中存储"电话:123-邮箱:abc@xx.com"（可拆分为两个字段）
正例：拆分为"电话"和"邮箱"两个独立字段

1.2 第二范式（2NF）：消除部分依赖

在1NF基础上，非主键字段必须完全依赖于主键（不能只依赖主键的一部分）。

反例：订单表（订单ID, 产品ID, 产品名称, 订单日期）
问题："产品名称"只依赖"产品ID"（主键是订单ID+产品ID）
正例：拆分为订单表（订单ID, 产品ID, 订单日期）和产品表（产品ID, 产品名称）

1.3 第三范式（3NF）：消除传递依赖

在2NF基础上，非主键字段不能依赖于其他非主键字段（即不传递依赖）。

反例：用户表（用户ID, 姓名, 部门ID, 部门名称）
问题："部门名称"依赖"部门ID"，而非直接依赖主键"用户ID"
正例：拆分为用户表（用户ID, 姓名, 部门ID）和部门表（部门ID, 部门名称）

提示：范式并非越高越好，实际设计中可适当反范式化（如增加冗余字段）提升查询效率。

2. 主键与外键设计原则

2.1 主键（Primary Key）

每个表应有唯一主键，用于唯一标识一条记录
推荐使用无业务含义的自增ID或UUID（避免用手机号、身份证等可变化的业务字段）
主键应简洁（如int类型比字符串更高效）

2.2 外键（Foreign Key）

用于关联两个表，指向另一表的主键
通过外键约束保证数据一致性（如删除主表记录时，子表关联记录需处理：级联删除/置空/报错）
命名建议：用"关联表名_主键名"，如"user_id"、"order_id"

用户表（users）： id (主键), name, age
订单表（orders）： id (主键), user_id (外键，关联users.id), amount

3. 避免数据冗余

冗余数据指重复存储的信息，会导致更新异常（修改一处时需同步修改多处）。

反例：在"订单表"和"订单详情表"中都存储"客户姓名"
优化：只在"客户表"存储一次，其他表通过客户ID关联查询

例外：在高并发场景下，可故意保留少量冗余（如商品列表中的"分类名称"），以减少关联查询，提升性能。

4. 字段设计合理性

选择合适的数据类型：如存储日期用DATE而非VARCHAR；整数用INT而非BIGINT（节省空间）
设置合理长度：如"手机号"固定11位，用CHAR(11)而非VARCHAR(20)
添加必要约束：
- NOT NULL：必填字段（如用户名、订单号）
- UNIQUE：唯一值（如邮箱、手机号）
- DEFAULT：默认值（如状态默认0，创建时间默认当前时间）
使用统一命名规范：如用snake_case（小写+下划线），避免中文/特殊字符

<

字段含义 <	推荐类型 <	不推荐类型
用户ID	INT/BIGINT（自增）	VARCHAR(50)
邮箱	VARCHAR(100) + UNIQUE	TEXT
创建时间	DATETIME/TIMESTAMP	VARCHAR(20)
状态（启用/禁用）	TINYINT（0/1）	VARCHAR(10)

5. 表与关系设计

表之间的关系主要有三种：

5.1 一对一（1:1）

两个表的记录一一对应（如"用户表"和"用户详情表"）。

解决方案：在其中一个表添加外键，关联另一表的主键，并设置外键唯一（UNIQUE）。

5.2 一对多（1:N）

一个表的记录对应另一表的多条记录（如"用户表"和"订单表"）。

解决方案：在"多"的一方添加外键，关联"一"的一方的主键（如订单表添加user_id）。

5.3 多对多（M:N）

两个表的记录相互对应多条（如"学生表"和"课程表"）。

解决方案：创建中间表，存储两个表的主键作为联合主键（如"学生课程表"含student_id和course_id）。

6. 考虑查询效率

添加合适索引：对频繁查询的字段（如WHERE条件、JOIN字段）建立索引，但索引不宜过多（会降低插入/更新效率）
拆分大表：对数据量大的表（如日志表、订单表）按时间/地区拆分（分表分库）
避免过度设计：不要为未来可能的需求提前创建不必要的表和字段

7. 维护数据完整性

实体完整性：通过主键保证每条记录唯一
参照完整性：通过外键保证关联数据有效（如不能引用不存在的用户ID）
域完整性：通过数据类型、约束（如CHECK、NOT NULL）保证字段值有效
添加审计字段：如create_time（创建时间）、update_time（更新时间）、create_by（创建人），便于追踪数据变更

8. 命名规范一致性

统一的命名规范可提高可读性和可维护性：

表名：用复数名词，小写+下划线，如users、orders、product_categories
字段名：小写+下划线，如user_id、create_time、is_deleted
索引名：前缀+字段名，如idx_user_id（普通索引）、uk_email（唯一索引）
避免使用数据库关键字（如order、user、table）

9. 预留扩展空间

设计时需考虑未来需求变化：

状态字段预留值：如状态用0-9表示基础状态，10-99预留未来扩展
重要表添加is_deleted字段（逻辑删除），而非物理删除数据
对可能增长的字段选择合适类型（如用户量大会员ID用BIGINT而非INT）

10. 文档化设计

完善的文档是后期维护的关键：

绘制ER图（实体关系图），展示表之间的关系
编写数据字典，说明表用途、字段含义、约束规则
记录设计思路和特殊处理逻辑（如为何冗余某字段）