西西河

主题:LINUX能做那些事? LINUX与WINDOWS的比较.欢迎大家补充. -- spin

共:💬77 🌺45 新:
全看分页树展 · 主题 跟帖
家园 我是说错了。问题其实不在大小上,

而是在质量上和自动化上。

先说质量,这个其实我不懂。不少老美使劲夸latex排出来的漂亮,我却看不出太大的区别。排出来的公式,我导师一眼就能看出什么地方我的latex命令用错了,以至出来的效果不对。而word,我记得大一点的公式排出来就不专业了。各种字体之间很细小的差别,我拼命也看不出来,但对他们却很明显。这倒也不奇怪,老美看亚洲人不都是一个样么?我们就看得出区别。我看双胞胎不都一个样么?非就看得出区别。为什么这么强调这些细节呢?因为这是专业出版于业余印刷的区别。一本论文印出来一看样子就是业余的,就没什么人去看了。这个tex排版软件,是当年knuth大爷的得意之作,围绕着它还有不少的传奇故事。但是,从开发之初,这个软件就是面向专业出版的,精益求精,排版质量绝对精良。

再说自动化。我之所以说word还只停留在电动打字机的思想上,就是指的这个自动化。问题的根本,其实在word文档的非结构化上(和网络中的semantic web要解决的是同一个问题)。很多人试图做word文档于其他格式文档的相互转化,却总是有各种各样的小问题,为什么?就因为它的数据是非结构化的。大到一本书的章,节,小节,与里面的插图,表格,引文的关系。一个引文,包含了作者,出版年月,出现的会议或杂志。一个作者的名字,还包含了姓,名,以及中间名。一个公式有各个组成部分,并且是嵌套的。这些就是一个文档的结构。这个结构与其表现形式(用什么字体,几号,什么颜色,每行多宽,页边留多宽等等)是无关的。原来word的问题,就在于把结构的信息和表现形式混在了一起,甚至用表现形式来表达结构,以至于结构信息不可完全复原。highway一定懂xml,xml的本质是什么?就是结构与表现的分离。html某种意义上有与word一样的毛病,所以人们才创造了xml。xml是微软主推的,在这件事上,善莫大焉。但是在排版软件上,它却走了几十年的弯路,设计latex的人从一开始就意识到了结构化的问题,虽然latex里也参杂了关于表现形式的信息,但结构的信息没有被损坏。我们只要对表现形式进行一次定义,计算机就会自动把它运用到所有地方,生成格式完全统一的文档。只要把表现形式的定义稍稍改一下,就又生成了一个完全不同的文档。让机器理解事物的结构,是不少任务自动化成为可能的根本。这就是我理解的latex相对word的优越性。

上面说了半天,其实时说的“以前”的word。因为我听说微软的办公软件正在全面xml化。上面highway似乎是说word可以读入xml数据来自动生成文档(是这个意思么?)我就小小吃了一惊。那么至少我们知道微软正走在正确的道路上。我承认我其实不了解最新版的word。不过让我问几个问题,就可以对大致情况有一点了解:

1。word能不能输出存粹的xml文档,如果能,请搞一个复杂一点的例子(有章节,有插图,有引文,有大公式)给我看看,大致就能有一点感觉。

2。能不能插入论文引用,并且在文章末尾自动生成所有被引用文章的列表?能不能很容易的把所有引文换一种格式,比如原来是(High Way 2003), 我现在想全部换成(H. Way, CCHERE, 2003)

3。能不能自动生成插图,公式的列表(包含页码)?

4。你现在写了一边文章,本来准备投给A杂志的,被据,现在要投给B杂志了,但两个杂志的格式要求完全不同,能不能轻松改过来?

5.能不能自动把所有内容转化成html(我是说所有啊,自动分好章节,每节一页,做好目录,包括插图,引文,并且自动生成到插图引文的链接) (请看latex的例子 http://www.gnu.org/software/emacs/manual/ )

我看了一下我的专业相关的会议和刊物,一般的style文件都是给latex和framemaker的,没有word,这可能还是说明一点问题的。

全看分页树展 · 主题 跟帖


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河