互联网大厂工程架构 —— Monorepo 与内部开源

1. 什么是 Monorepo？(从入门到入魔)

Monorepo (Monolithic Repository) 指的是将多个项目（Project A, Project B, Shared Libs）的代码存储在同一个 Git 仓库中，而不是拆分成多个独立的仓库（Polyrepo）。

普通段位 (物理大仓):
- 做法： 也就是一个普通的 Git 仓库，里面分了几个文件夹。
- 操作： git clone 下载所有文件到本地硬盘。
- 适用： 中小型团队，代码量在 GB 级别以下。
大厂段位 (虚拟大仓 - Google/ByteDance模式):
- 背景： 代码量达到 TB 级别，普通 Git 无法处理。
- 核心技术： VFS (虚拟文件系统) + 定制 Git。
- 操作： git clone 只是挂载一个"目录索引"，不下载真实文件。只有当你打开某个文件时，系统才会按需流式传输内容。
- 类比： 就像 Netflix 在线看片（按需缓冲），而不是把全网电影下载到硬盘。

在多仓库模式下（如传统的 Maven/Nexus 流程），引用隔壁组的库需要经过繁琐的步骤：

在 Monorepo 模式下，依赖配置发生了质变：

# 伪代码示例 (Bazel风格)
dependencies = [
    "//common/security/utils:latest"  # 直接指向隔壁文件夹
]

优势：
1. 无版本号： 永远使用主干（Master/Main）上最新的代码，消灭了版本碎片。
2. 原子性修改 (Atomic Change)： 基础架构组修改底层 API 时，可以一个 Commit 修改全公司所有受影响的代码。一秒钟，全公司同步升级。
3. 零发布： 不需要"发版"，改了代码，依赖方下次编译立刻生效。

"默认开放"。在 Google、Facebook、字节跳动等公司，90% 以上的代码对全员（包括实习生）可见。

虽然代码可见，但配套了极强的风控手段（宽进严出）：

数字水印： 屏幕上显示肉眼不可见的工号水印，拍照泄密可直接溯源。
行为审计： 后台记录所有搜索、浏览、下载行为。异常的大量下载会触发安全报警。
绝密隔离 (ACL)： 剩下的 10% 核心代码（如搜索排序权重、推荐算法参数、密钥证书、用户隐私数据）设有严格的权限控制（Access Control List），普通员工不可见。