- 主题:能不能用人工智能分析下后四十回
不甚靠谱。
某人网名“江少爷”统计,前80回“一语未了”出现23次,后40回出现0次,兴奋的认为自己证明后40回不是曹雪芹写的。
但是归锄子《红楼梦补》,写林黛玉借尸还魂和贾宝玉结婚,大观园众女子,贾雨村,贾政,王夫人,薛姨妈,贾珍,等等在林黛玉数千万两银子之下过着幸福安乐的日子。《红楼梦补》48回,“一语未了”出现了17次。按照江少爷的说法,《红楼梦补》是曹雪芹写的!
【 在 handsomest 的大作中提到: 】
: 一班来说,特定作者的用词是有规律的。用人工智能统计分析一下看看是不是有明显区别。
--
FROM 27.211.38.*
逻辑是不对,但我这个不对的逻辑没什么影响力。
刘心武电视讲座的逻辑:一查资料曹雪芹和高鹗根本不认识,所以前八十回和后四十回根本没关系。这个不对的逻辑可是影响了一波观众。你去揭露一下其中的逻辑漏洞更有意义。
另外你的说法不对,逆否命题与原命题等价,否命题和逆命题与原命题不等价,你把否命题错说成逆否命题了。
【 在 wonderdream 的大作中提到: 】
: 你这个举例的逻辑不对吧。人家这个网友提出了一个正命题“某词前后使用频率很不一致,说明前后很可能不是一个作者”,但人家可从来没说逆否命题也成立(“使用频率一致就必须是一个作者”)。不能替人家脑补。
: 这就好比,第一份验血记录是A型,如果第二份验血记录是B型,人家会说“血型不一致,证明不是同一个人做的测试”;但如果第二份验血记录记录也是A型,人家可不会说“血型一致,证明一定是同一个人做的测试”,因为大家都知道天底下A型血人多如牛毛。
:
: ...................
--
FROM 123.232.150.*
说到点子上了。只有提出正确的问题,数学模型才有意义。
后四十回本身是经过程伟元高鹗编辑的,与前文用词偏差不能说明它不来源于曹雪芹。
这种数学模型如果用庚辰本80回对比程甲本40回,那么前后依据的是完全不同路径的辗转传抄的抄本;甲辰本与庚辰本正文差别3万字以上,用词差别已经很大了,用数学模型检验一下庚辰本和甲辰本,都是前八十回,估计也会得出作者不一的结论。
【 在 icetea 的大作中提到: 】
: 分析了可能也说明不了什么问题,程伟元序中提到过他得到后四十回的经过,集腋
: 成裘收集多年,又意外在鼓担上得到了十几卷,高鹗也说做了一定的编辑工作的。
: 如果假定程的说法可信,那他收集的后四十回更可能是来自多个不同抄本,并且可能
: ...................
--
FROM 123.232.150.*
陈炳藻使用的是程高本120回统计,出自一人之手
后来有人说用程高本不合理, 用庚辰80对照程甲40,结论是出自两人。
事实上用庚辰80对比程高40,这种方式也不合理,因为程高本后40回是在抢救回来的散乱抄本上编辑而成的。
正如用庚辰本对比程乙本前80回,大概率也会得出二者出自两人之手的结论,但不能因此就说程乙本前80回不是曹雪芹创作的。
【 在 defeatyou 的大作中提到: 】
: 我上面贴了
: 早就有人用计算机分析过,结论是出自一人之手
--
FROM 124.133.236.*