<label id="jgr5k"></label>
    <legend id="jgr5k"><track id="jgr5k"></track></legend>

    <sub id="jgr5k"></sub>
  1. <u id="jgr5k"></u>
      久草国产视频,91资源总站,在线免费看AV,丁香婷婷社区,久久精品99久久久久久久久,色天使av,无码探花,香蕉av在线
      您正在使用IE低版瀏覽器,為了您的雷峰網賬號安全和更好的產品體驗,強烈建議使用更快更安全的瀏覽器
      此為臨時鏈接,僅用于文章預覽,將在時失效
      人工智能開發者 正文
      發私信給AI研習社
      發送

      0

      我分析了 6.5W 字的歌詞,看到了這樣的周杰倫

      本文作者: AI研習社 2017-05-13 21:18
      導語:用大數據素描周杰倫。

      我分析了 6.5W 字的歌詞,看到了這樣的周杰倫

      雷鋒網按:本文作者冬鑫,原文載于作者知乎專欄,雷鋒網已獲授權。

      前一段時間分析民謠歌詞的那邊文章特別火,剛好在研究使用python處理數據,就也想弄個類似東西練練手。于是乎,拉上自己親妹妹 @張小黑 就開始分工。

        一、準備歌詞素材

      歌詞選擇:杰倫至今的所有專輯(從最開始的<JAY>到最新的<周杰倫的床邊故事>)

      由于爬蟲木有學會,就只能手動收集歌詞。經過一系列的 google、baidu,終于找到別人整理好的歌詞全集。ok,就這樣歌詞文件搞定了,一共也沒多大,也就207K(想想周董這么多年唱的歌詞大半都在這207K的txt文件里就不免有些感慨)。

      我分析了 6.5W 字的歌詞,看到了這樣的周杰倫

        二、對歌詞文件完成分詞

      這是最難的部分,產品汪只會跟程序猿們相愛相殺,哪會寫代碼呀!!!

      我分析了 6.5W 字的歌詞,看到了這樣的周杰倫

      沒辦法,硬著頭皮也要寫。網上goolge各種關鍵字,看博客,花了半天的時間,連蒙帶猜,勉勉強強看懂了網上的代碼示例,比著葫蘆畫瓢寫了一點點寫。

      我分析了 6.5W 字的歌詞,看到了這樣的周杰倫

      千難萬險,終于寫完調通,最終主要的部分一共也就12行,沒有任何注釋(簡直乞丐版代碼,根本看不出來哪里sexy ~~~~(>_<)~~~~)

      我分析了 6.5W 字的歌詞,看到了這樣的周杰倫

        三、對分詞的結果進行分析

      好,我們終于到了正文,以上都是廢話,下邊才是重要結論。(如果以這種方式寫郵件一定會被老板打死 ?(^?^*) )

      結論一:杰倫最喜歡的唱的主題 --- 情歌 (我自己也知道這是廢話 O(∩_∩)O)

      我分析了 6.5W 字的歌詞,看到了這樣的周杰倫

      拉了下出現頻率 top20 的詞語,滿滿的都是文藝、傷感、愛情 :

      我們 / 怎么 / 沒有 / 微笑 / 離開 / 愛情 / 回憶 / 不要 / 開始 / 如果 / 怎么 / 開始

      我擦,感覺隨機排列組合都能成歌詞,方文山以后是不是就可以下崗了 ?(^?^*)

      結論二:杰倫喜歡媽媽勝過爸爸,喜歡外婆勝過爺爺以及外公(歌詞中沒有出現奶奶)

      我分析了 6.5W 字的歌詞,看到了這樣的周杰倫

      大家應該都聽過<聽媽媽的話>。

      杰倫專門為外婆寫了一首歌<外婆>,其中也就1句歌詞提到了外公。

      至于爺爺,杰倫也有那首<爺爺泡的茶>

      結論三:杰倫喜歡黑色、白色勝過其他顏色

      我分析了 6.5W 字的歌詞,看到了這樣的周杰倫

      很符合周董的形象,歌詞里高大上的黑色&白色力壓其他顏色。看到黑白兩色頻率這么高,我第一時間想到的是<以父之名>,感覺很符合那個氣質。還有就是青色出現了6次,大概率是因為<青花瓷>吧。

      結論四:杰倫最喜歡的語氣詞是 oh~

      我分析了 6.5W 字的歌詞,看到了這樣的周杰倫

      毋庸置疑,杰倫最喜歡 oh~ ,排除大小寫的因素,[oh] 出現的頻率甚至超過 [我們] 成為出現詞頻最高的詞匯。此外杰倫經典的 "哎呦不錯哦~" 中的 [哎呦] 也名列前茅,看來杰倫真的很喜歡講這句話。

      總結:只是從歌詞來看,大概杰倫就是一個穿著黑白帽衫,表面上酷酷的,但是骨子里滿是深情、文藝, 只喜歡喝爺爺泡的茶,聽媽媽的話,愛自己外婆的 ,嘴里時不時地冒出一句‘哎呦,不錯哦’ 的 五好青年 ^_^

      注:以上內容純屬胡說八道,如有雷同,純屬巧合。

      另,頭圖不是 python 生成,是使用一個國外的網站(wordart)生成的。文章中使用的分詞代碼、歌詞文本、頭圖已通過有道云筆記分享(文章末尾有鏈接),內容如下:

      我分析了 6.5W 字的歌詞,看到了這樣的周杰倫           

      有道云筆記鏈接:http://t.cn/RaICFIV 

      TensorFlow & 神經網絡算法高級應用班” 要開課啦!

      從初級到高級,理論 + 實戰,一站式深度了解 TensorFlow!

      本課程面向深度學習開發者,講授如何利用 TensorFlow 解決圖像識別、文本分析等具體問題。課程跨度為 10 周,將從 TensorFlow 的原理與基礎實戰技巧開始,一步步教授學員如何在 TensorFlow 上搭建 CNN、自編碼、RNN、GAN 等模型,并最終掌握一整套基于 TensorFlow 做深度學習開發的專業技能。

      兩名授課老師佟達、白發川身為 ThoughtWorks 的資深技術專家,具有豐富的大數據平臺搭建、深度學習系統開發項目經驗。

      時間:每周二、四晚 20:00-21:00

      開課時長:總學時 20 小時,分 10 周完成,每周 2 次,每次 1 小時

      線上授課地址:http://www.mooc.ai/

      雷鋒網(公眾號:雷鋒網)相關閱讀:

      不再收費!MapD數據庫開源,過來人指點如何上手

      你和真正的數據科學究竟差在哪里

      雷峰網版權文章,未經授權禁止轉載。詳情見轉載須知

      我分析了 6.5W 字的歌詞,看到了這樣的周杰倫

      分享:
      相關文章

      編輯

      聚焦數據科學,連接 AI 開發者。更多精彩內容,請訪問:yanxishe.com
      當月熱門文章
      最新文章
      請填寫申請人資料
      姓名
      電話
      郵箱
      微信號
      作品鏈接
      個人簡介
      為了您的賬戶安全,請驗證郵箱
      您的郵箱還未驗證,完成可獲20積分喲!
      請驗證您的郵箱
      立即驗證
      完善賬號信息
      您的賬號已經綁定,現在您可以設置密碼以方便用郵箱登錄
      立即設置 以后再說
      主站蜘蛛池模板: 微博| 抚顺市| 国产69精品久久久久人妻刘玥| 国产精品综合| 亚洲网站色| 亚洲经典在线中文字幕| 丰满多毛的陰户视频| 国产白嫩护士被弄高潮| 成人欧美一区二区三区白人| 国产精品人妻一区二区三区| 亚洲国产午夜精品福利| 亚洲一区精品无码色成人| 精品国产品香蕉在线| 久久精品免视看国产成人| 精品深夜av无码一区二区| 余干县| 国产精成人品| 干干日日| 久久狠狠高潮亚洲精品| 亚洲熟女豪乳视频| 亚洲成人大香蕉| 亚洲国产午夜精品福利| 强开少妇嫩苞又嫩又紧九色| 日本一区二区精品色超碰| 欧美第一黄网免费网站| 图片区小说区激情区偷拍区| 国产在线永久视频| 果冻传媒一区| 精选国产av精选一区二区三区| 国产成人无码精品久久久露脸| 婷婷91| 久久久久久曰本av免费免费| AV在线亚洲天堂| 丰满人妻一区二区三区视频54| 亚洲鸥美日韩精品久久| 国产精品美女久久久久久麻豆| 精品国内自产拍在线观看| 热99re久久免费视精品频| 日本免费精品一区二区三区| 国产在线一区二区不卡| 国产成人无码一区二区在线播放|