论文方法页

公式、变量字典与网页图示的教学版展开

这里不是把论文文字机械贴到网页里,而是把原始方法拆成可讲授的公式卡片、变量字典、对应图示与方法叙事。即使不读论文正文,也能看懂模型为什么要这样设计。

论文方法总流程图

论文页重点回答五个问题

  1. 模型解决的核心问题和目标是什么。
  2. 创新优化了什么。
  3. 具体的算法实现方法是什么。
  4. 实验是如何进行的。
  5. 核心结论和效果是什么。
公式教学卡

从变量到图示,把方法讲透

每一张卡片都包含公式、变量字典和对应网页图示。这样观众不会只看见一行公式,而是能把符号、算法和网页中的可视对象对应起来。

公式教学卡

场景状态表示

\[\mathbf{Z}=\{(b_i,c_i,a_i,x_i,r_i)\}_{i=1}^{N}\]

我们不是把历史空间理解为一张静态图片,而是把每个对象写成一组可推理、可优化的状态变量。

b_i对象的二维 footprint 与边界盒,用来表示平面占据。
c_i对象类别,如门、院、厅、桥、水岸、摊铺。
a_i对象属性,如置信度、功能标签、空间等级。
x_i连续几何参数,决定位置、尺度、朝向与相对偏移。
r_i对象之间的语义关系,如 front_back、access、near_water。
场景状态表示

网页图示把对象、关系和几何状态拆成可计算单元,说明系统为什么能同时处理建筑、道路、水体与礼序关系。

公式教学卡

证据驱动提案

\[\hat{\mathbf{Z}}^{(0)} = f_{\theta}\!\left(\mathcal{G}^{\mathrm{evid}}\right)\]

证据图首先给出一个初始提案,说明从公开资料出发,模型会先构造出怎样的候选空间结构。

\mathcal{G}^{\mathrm{evid}}证据图,承接文本、图像、考古与地图片段。
f_{\theta}证据提案网络,输出对象存在性、关系初值与几何草案。
\hat{\mathbf{Z}}^{(0)}初始空间提案,是后续规则协调与修复的起点。
证据驱动提案

图中由证据节点汇聚到场景草案,帮助观众理解“提案”并不是最终答案,而是待协调的起点。

公式教学卡

双图建模

\[\mathcal{G}^{\mathrm{evid}}=(\mathcal{V}^{\mathrm{evid}},E^{\mathrm{evid}},\mathbf{u}^{\mathrm{evid}}),\quad \mathcal{G}^{\mathrm{prior}}=(\mathcal{V}^{\mathrm{prior}},E^{\mathrm{prior}},\Pi)\]

论文的关键创新,是把证据和文化先验拆成两张图,而不是直接混成一团。

\mathcal{V}^{\mathrm{evid}}证据节点,代表对象候选、证据片段或空间锚点。
E^{\mathrm{evid}}证据边,表示共现、邻接或同源关系。
\mathbf{u}^{\mathrm{evid}}证据来源可靠度与不确定性向量。
\mathcal{V}^{\mathrm{prior}}先验节点,代表中轴、门阈、围合、水体等规则对象。
\Pi规则库,承接建筑风水文化与传统营建秩序。
双图建模

图示把“证据链”和“文化规则链”明确分开,让观众看清论文真正解决的是两类信息的协调问题。

公式教学卡

规则优先级控制器

\[\alpha(c)=[\alpha_1(c),\ldots,\alpha_R(c)],\qquad \alpha_r(c)\in[0,1]\]

不同场景并不共享同一套固定规则权重,控制器会根据上下文决定哪些规则更重要。

c当前场景上下文,包含场景类型、证据密度和不确定性。
\alpha_r(c)第 r 条规则在当前场景中的优先级。
R规则总数。
规则优先级控制器

图示显示院落、桥关、水岸和市街三类场景会激活不同的规则强度,这正是系统区别于固定模板拼装的地方。

公式教学卡

主能量函数

\[\mathcal{E}(\mathbf{Z})=\lambda_{\mathrm{evidence}}E_{\mathrm{evidence}}(\mathbf{Z})+\sum_{r=1}^{R}\alpha_r(c)\phi_r(\mathbf{Z})+\gamma\,\Psi(\mathbf{Z},\hat{\mathbf{Z}}^{(0)})\]

这个能量函数把证据一致性、文化一致性和对初始提案的偏移控制放进同一个优化目标里。

E_{\mathrm{evidence}}证据一致性项,要求结果不能脱离公开资料。
\phi_r第 r 条规则的惩罚项,反映礼序、围合、水体关系等要求。
\Psi(\mathbf{Z},\hat{\mathbf{Z}}^{(0)})偏离初始提案的成本,控制修改幅度。
\lambda_{\mathrm{evidence}}, \gamma证据与偏移两类目标的权重。
主能量函数

图示把三股力量画成汇聚于同一目标的流线,帮助观众理解为什么系统既不盲从规则,也不盲从证据。

公式教学卡

硬约束与修复

\[h_j(\mathbf{Z})=0,\ g_k(\mathbf{Z})\le 0,\qquad \mathbf{Z}^{\mathrm{repair}}=\arg\min_{\mathbf{Z}\in\Omega} C_{\mathrm{edit}}(\mathbf{Z},\hat{\mathbf{Z}})+\beta\sum_{r\in\mathcal{R}_{\mathrm{soft}}}w_r\phi_r(\mathbf{Z})\]

修复不是后期美化,而是在满足硬约束的可行空间中做最小编辑,让结果更稳定、更适合解释与展示。

h_j, g_k硬约束,负责非重叠、可达、门阈顺序、围合边界等条件。
\Omega满足全部硬约束的可行域。
C_{\mathrm{edit}}编辑代价,越小表示修改越克制。
\mathbf{Z}^{\mathrm{repair}}最终用于展示与讲解的修复结果。
硬约束与修复

图示把“提案”“协调”“修复”三阶段并列展示,观众能直接看见为什么最后一版更能通过规则检验。

公式教学卡

训练目标

\[\mathcal{L}=\mathcal{L}_{\mathrm{box}}+\mathcal{L}_{\mathrm{orient}}+\mathcal{L}_{\mathrm{height}}+\mathcal{L}_{\mathrm{priority}}\]

训练阶段并不是一句“把模型训好”就结束,而是让提案网络和优先级控制器分别学会几何预测与规则强度判断。

\mathcal{L}_{\mathrm{box}}对象平面几何回归损失。
\mathcal{L}_{\mathrm{orient}}朝向预测损失。
\mathcal{L}_{\mathrm{height}}体量高度预测损失。
\mathcal{L}_{\mathrm{priority}}规则优先级预测损失。
训练目标

图示把网络训练拆成四个目标,方便向非算法背景观众解释“模型究竟学到了什么”。

方法叙事

论文原始内容的网页化讲解

这里把论文从“问题定义”一路讲到“实验与结论”,避免用户只看到一些技术名词却不知道整篇论文到底完成了什么。

模型解决的核心问题和目标是什么

论文面对的是一个典型的数字人文难题:历史都城往往只有零散证据,没有直接可复原的完整蓝图。系统的目标不是制造一张看起来很古风的图片,而是把公开资料、传统建筑秩序和建筑风水文化转写为一条可解释的空间推断流程。

  • 输入是异质的公开资料:文本、图像、考古报道、地理片段。
  • 输出不是黑箱,而是“提案—协调—修复—展示”的完整链路。
  • 结果必须同时回应证据、规则和展示教学三类需求。

创新优化了什么

最核心的创新,是把“证据”和“文化先验”拆成两张图,并用规则优先级控制器在场景级上下文中动态调节它们的权重。这使系统既不会被某一条史料牵着走,也不会被僵硬规则压死。

  • 双图建模让证据与先验解耦,避免信息污染。
  • 优先级控制器让不同场景激活不同规则强度。
  • 最小编辑修复让结果在满足规则的同时保持证据忠实。

具体的算法实现方法是什么

算法实现由五步组成:资料包结构化、证据图提案、规则优先级判断、约束协调优化、最小编辑修复。网页中所有指标、图谱与三阶段图像都围绕这五步展开。

  • 先把场景整理成 Scene Packet,统一对象、关系、来源与证据项。
  • 再用提案网络输出对象、关系与几何初值。
  • 通过约束优化和修复得到最终可展示结果。

实验是如何进行的

实验先用合成 packet 训练提案网络与控制器,再在 6 个公开资料 packet 上做推理、评测和可视化。系统保留 evidence-only、uniform-prior、no-repair 和 full-model 四类结果,用于最小可发表对比。

  • 训练集是合成结构化 packet,保证基本几何与关系可学。
  • 测试集是公开资料扩包后的真实案例包。
  • 评测指标由证据一致性、文化一致性、规则满足率和编辑代价构成。

核心结论和效果是什么

当前系统在公开案例集上的 repaired 结果已经实现 FR=1.0,说明所有硬约束都能通过;同时 CC 保持较高水平,证明文化先验确实在提升空间秩序。网页端把这些结果进一步转化为教学图谱、案例对比和知识讲解,以服务展示和传播。

  • FR=1.0 表示当前公开案例都满足硬约束。
  • CC 明显高于 evidence-only,说明规则协调带来了结构提升。
  • 最终输出不仅能看,还能讲、能教、能被质疑和复核。