- 在算法领域,虽然存在一定程度的垄断,但是由于开源力量和研究大学的对抗,以及人们对于寡头的不信任,所以算法在很大程度上可以保持开放;
- 在算力方面,由于大模型的训练成本极高,算力只有大企业才能负担,所以这本质上导致了算法的生产完全被大企业控制;
- 在数据方面,虽然大模型的训练依靠的是公开数据,但是根据大模型的参数增长,公开数据很快将会耗尽,因此大模型的继续增长依赖于私有数据。虽然数量众多的小企业拥有的绝对数据量巨大,但是孤立存在难以利用,因此大企业仍然对数据具有垄断优势。

- 在数据方面,由于公开数据在2030年之后将被消耗完,更有价值更大数量的私有数据需要通过区块链技术保护隐私的前提下被利用;
- 在数据标注方面,可以通过代币激励更大规模的标注和核查数据;
- 在模型训练阶段,通过模型分享,协作训练来实现算力共享;
- 在模型微调阶段,可以通过代币激励社区的参与;
- 在用户查询推理计算阶段,区块链可以保护用户数据隐私。





- 每个人都有一个相对应的控制的边缘节点;
- 绝大多数应用场景的计算和存储都应该放在边缘节点处理;
- 个人节点与个人节点之间的协作通过区块链来完成;
- 节点与节点之间的通信通过P2P完成;
- 个人可以单独完全控制自己的节点或者委托信任的人委托管理节点(在有些场景下被称为relay server);
- 实现了最大可能的去中心化;