0

作者|李梅
編輯|陳彩嫻
后天就要高考了,各位是不是已經開始緊張了(誤)?
雖然咱不參加高考,但每年還是會例行關注一波高考作文題。畢竟都是被虐過的人,依稀還記得那些年的「絲瓜藤和肉豆須」、「舉報我爹開車打電話」、「齊桓公、管仲和鮑叔」......
而高考前,除了老師和考生,吃瓜群眾也會積極投身于「語文作文押題」這一重大工程中
。
最近就有一位B站UP主 @圖靈的貓 整出了新活,用AI預測出了今年高考最有可能出現的7大命題。
在視頻里,UP主分別展示了這7個命題的「核心詞」、「預測主題」和「模型表征」:
困難、希望

拼搏、自強

探索、夢想

創新、發展

奮斗、價值

公平、德育

美、環境

怎么樣,是不是很有內味兒?
那這個預測模型是如何工作的呢?據UP主介紹,與人工命題需要從大量熱點事件、政策文件中提取和篩選主題、進行命題類似,AI也需要從大量數據中挖掘規律,獲取的數據越多、分布越合理,預測的準確性也會越高。

為了獲取盡可能多的數據,UP主專門寫了一套爬蟲,來爬取過去一年內人民日報、人民網、央視新聞等官媒所發表的文章、期刊和報紙,以及高層會議的重要文件和講話。
之后,通過自然語言處理中的預訓練模型以及主題建模算法,這套AI系統可以理解中文語境下的新聞與文章,以此學習并模仿過去幾年的高考作文出題思路,結合過去一年中最為重要的事件脈絡,提煉成最終的題目短語。
不過,近年來的高考作文命題越來越向人生價值觀、家國情懷等「大格局」主題靠近,所以,類似于(以前的)江蘇卷和上海卷那樣思辨性強的作文題目,不在UP主的預測集范圍內。
UP主已將這套算法的代碼開源在了Github上,傳送門:https://github.com/EssayKillerBrain/EssayTopicPredict
此視頻一出,引發了B站網友的大量討論。考研黨、考公黨紛紛求預測考研英語作文題、考研政治題、公考國考題之類,這些題目與如今的高考作文命題的確有相似之處。當然還有很多抱有正確金錢觀的人士(如本人)想要AI來預測彩票開獎。
愛抖機靈的網友也已經開始替命題組緊張了,不過,也許命題組早已經用了另一套算法來反預測呢。


還有人在基于這些預測結果對全國卷的作文展開更具體的預測。

至于預測結果的準確性,還要等到兩天后見分曉,不過很多考生表示,在模擬考中他們的確已經遇到這些預測出來的主題,也都在自己老師預測到的范圍內。但從另一個角度看,這種預測結果似乎有點「聽君一席話,如聽一席話」了,這些核心詞和主題都是過去一年的熱點,不用AI,我也能押...而命題組不按常理出牌也是常有的事,重點劃得太多,相當于沒有重點。


也有網友懷疑預測結果是不是過擬合了,畢竟有些熱點事件在新聞中的存在感很強,但與語文作文命題的關聯性也許并不大。

另外,對于幫助人類寫作文、批改作業、預測考題等AI產品,我們也要考慮用途正當性的問題。正如UP在視頻中所提到的,類似的AI模型一經出現,就會被很多嗅到商機的人利用去牟利,去二手交易平臺逛一逛就會發現,已經有很多人在賣各種「寫作神器」、「AI文章自動生成器」之類的,而有些就是完全復制自這位UP主之前開發出的AI寫作文的模型,所以還存在知識產權難以得到保護的問題。
對于我們大多數人來說,還是有用則用,無用就圖一樂吧~
最后,我們祝全國考生旗開得勝,金榜題名。
B站視頻鏈接:
https://www.bilibili.com/video/BV1j34y177Wz?spm_id_from=333.851.b_7265636f6d6d656e64.6

雷峰網(公眾號:雷峰網)
雷峰網版權文章,未經授權禁止轉載。詳情見轉載須知。