Zh-hans:Automated Edits code of conduct
自动编辑OpenStreetMap时需要遵循自动编辑行为准则。 无论是使用机器人和数据导入脚本,还是使用JOSM这样的标准编辑器里面类似「查找并替换」的功能做较大的更改,但凡是做批量编辑,都需要遵守该准则。这是为了防止数据库受损:回滚不适宜的编辑非常困难甚至几乎不可能,尤其是这些编辑过的内容又得到了新的改动的话,他人需要可观的工作量才可能修复损害。忽视该准则会视为破坏者,多次违反会被处理。
在SOTM 2016上有场讲演介绍了这些问题的大致情况。
适用范围
总的来讲,所有不经过编辑者自己核验的改动都适用此准则。这包括:
- 机器人作出的改动,这些改动据定义就没有人类参与。
- 数据导入,既包括全自动导入,也包括使用标准编辑器操作的导入。
- 使用其它脚本的编辑。
- 使用JOSM这种标准编辑器的「查找并替换」功能,或者用Overpass API编辑而不对每一项改动做人工覆核。
- 手动更改标签却不做恰当的覆核。
即使认为自己要做的批量编辑不属于准则使用的范围,与社区提前讨论要做的改动仍是值得提倡的。编辑者可能不清楚本地社区对目前做标签方式所形成的共识,也可能错误理解了OpenStreetMap百科上的某些词条。提前讨论可以让编辑者更不容易因为需要回滚恭喜而变得沮丧。
指导方针
谨慎!
OpenStreetMap基于一致意见而非多数表决,因此,即使绝大多数人支持某项大型编辑,真的实施之前仍然需要三思。请注意本百科上关于标签的页面并不是「正确」做标签方式的最高标准。
编辑者所想做的更新,或许会改动来自其所不熟悉的地域和文化的其他贡献者的编辑,因此在更新前要做细致研究和规划,以专业的方式完成编辑。在编辑的任何阶段,如果受到质疑,请得体回应,注意倾听,避免编辑战。如果争端无法得到解决,延请他人居中调解。
可接受的用法
- 修正显然的拼写错误,比如说把「hihgway=residential」改成「highway=residential」。
- 更正编辑者自己的工作。如果编辑者知道自己有过系统性的失误,使用自动编辑更正不失为好方法。但要注意使用自动编辑而产生不曾预料后果的风险。
- 如果受人所托更正其失误,也可归于此类。
- 防止枯燥的手动编辑。需要经过社区讨论和许可。
有问题的用法
- 为了主张某特定「方针」而使用自动编辑工具。编辑者对方针或许有与众不同的理解,「方针」本身也可能未得到广泛认可。比方说,一位或一小群编辑者主张某种「编码规范」,未经恰当的广泛咨议就使用自动编辑工具应用该规则。再次注意本百科并不定义何为正确做标签的方式,不能以百科条目为依据做不经恰当咨议的大幅编辑。
- 在已有数据基础上导入新数据,却不以恰当方式兼容已有数据,或者违背其它导入方针。
- 其它方式
在自动编辑之外,可以像诸如Keep Right和osmose这样的品质保证工具提交工单,让有时间、对当地有所了解的人认真覆核改动。
记录和讨论
如果打算做自动编辑,要先在百科上为计划做记录,在适宜的邮件列表上讨论该计划:
- 使用讨论列表。(通用邮件列表)
- 如果有关先前和当前的数据导入,使用导入列表。
- 如果编辑只影响特定国家或地域,使用该相关地域的讨论渠道,通常是当地语言邮件列表或论坛。
- 如果编辑只影响特定城镇或小型区域,使用本地邮件列表、论坛、或者别的标准本地交流渠道。
- 当编辑与特定专业领域相关时,例如与公共交通[1]有关,编辑者还需要在领域邮件列表上发起讨论。
如果计划得到广泛认同,却有一小部分异议者,需要同彼等合作,找到其反对的原因。如无法达成一致,考虑为其编辑或区域添加例外。倘若反对者更众则应当重新考虑编辑计划。
对已获批准之计划,任何新的改动和拓展都需要再以相同方式获得新的社区认可。没有可能批准「更正写错的标签」之类的泛泛计划。
正常情况下编辑者需要在英文百科条目「Automated edits/username」下记录其编辑计划(其中「username」应被替换为打算用于提交编辑的OSM账户用户名,请提前仔细考虑以免之后重命名页面),并将条目添加到Category:Automated edits log范畴当中。
编辑者的记录需要申明:
- 编辑者身份。(最好是真实姓名和联系方式,以电子邮件地址为最优)
- 编辑动机,为什么该编辑很重要。
- 自动编辑算法的详细描述,怎么确定哪些元素被如何修改。
- 已完成咨议的信息,提供到相关邮件列表、论坛或是百科讨论页的链接。
- 改动何时执行。对于会反复执行的改动,给出其运行频率。
- 如何选择「不参与」。
- 已受批准机器人需要有与其同名的百科条目,以及同名用户账户。二者之间需要有清晰超链接互通。
小心执行
编辑者应当:
- 在使用新机器人时先执行少量的编辑,然后再继续较大的编辑。
- 确保只在最新数据集基础上更新,以免因使用较早Planet文件而意外覆盖他人新近的修改。
- 做好所需数据备份,以备出现问题时恢复所做改变。
- 合理设置改变集。为所有编辑创建单独的改变集会使其对人类来说变得非常难读。有同样的行为人类用户会被认为是在玩弄系统,因为它给人以做出了比实际更多编辑的印象。另一个极端是为一些分布在地球上不同地方的改动只创造单一改变集,这同样非常难读,还会污染与特定改动距离遥远地区的编辑历史。以小区域归类的改变集最便于人类贡献者理解,比如「修正橙县高速公路标签」。
- 确保有办法识别自动编辑的结果。可以为脚本单独创建用户账户,也可以添加「source」、「created_by」或是「note」之类的标签。
- 为改变集打上「comment」标签,以人类可读方式描述该改变集所作出的改动。还需要打上「mechanical=yes」或者「bot=yes」的标签,添加到前述「记录」的百科条目或者用户页面的超链接,比方说打上「description=*」标签,就像是「description=https://wiki.openstreetmap.org/wiki/Mechanical Edits/John Doe#Tag Fixup January 2013」一样。
- 尊重「不参与」意愿。如果被要求停止自动编辑他人所做编辑,需要遵从该愿望,并更新程序以便未来不再触碰这些内容。
争端解决
广泛的讨论也无法避免出现不满意编辑内容的人。请为之做好准备,认真而有礼貌地处理用户投诉。如果遵守了本行为准则,编辑者的账户不会因为投诉而被立即封禁,不过如果人们不喜欢该自动编辑本身或其副作用的话,编辑者仍可能不得不改变或停止其自动编辑。
即使遵守了本行为准则,编辑仍可能被撤销:准则不保证编辑会被接受。数据工作组将对无法通过上述方式解决的问题进行调查和处理,并可能立即封禁编辑者账户,或是向其发出警告信息(取决于编辑的强度)。不遵循本准则的编辑可能一经发现就被迅速回滚。如果不符合行为准则的编辑与「规范」的编辑混杂一处,难以区分,那么回滚有问题的编辑时或许也会附带损害「规范」编辑。
参考
- Import/Guidelines
- Wikipedia's bot policy - a good reference even if it has no jurisdiction here.