發表文章

目前顯示的是 7月, 2021的文章

評論 「【驗證】統計5,000首Vocaloid樂曲的歌詞→調查前100個最常被使用的詞彙」

圖片
 評論「【驗證】統計5,000首Vocaloid樂曲的歌詞→調查前100個最常被使用的詞彙」 ( 【検証】約5000曲のボカロ楽曲の歌詞を集計→最も使われている単語TOP100を調査 ) (原文: https://originalnews.nico/322413 ,文章發表於2021年07月21日) (圖片來自影片截圖) 大家好,這裏是潛水已久的CCT。 最近看到Niconico新聞對一支Niconico動畫上面的 影片 發表專文介紹, (影片發表於2021年04月10日), 內容是說該影片的作者統計了5,000首Vocaloid名曲,排名出這些Vocaloid樂曲的歌詞中,前100個最常被使用的詞彙。 這是個相當有趣的影片,也推薦大家看看統計結果;而影片也激發出個人的一些思考,因此誕生了這篇文章:這篇文章試圖介紹及評論該專文與其介紹的影片,並闡述我個人認為這個排名結果大多其實「並不意外」,榜上有名的詞彙大多與殿不殿堂、Vo不Vocaloid沒什麼關係: 因為它們大多是日本語本身乃至世界大多數語言都常見的詞彙。 (本文稍後會暴雷前10名,如果不想被暴雷可以先看文章或影片) ====Intro:這支影片在統計什麼?如何統計?==== 《統計5,000首Vocaloid樂曲的歌詞》這支影片,首先在統計母體的選擇上,作者在一個收錄著眾多Vocaloid樂曲歌詞的網站「 初音ミクwiki 」之中,統計其中進入殿堂 (即該曲在Niconico動畫之中觀看次數10萬以上) 的Vocaloid樂曲,數量大約是5,000首,是目前 (2021.07.22) 所有Vocaloid殿堂曲的9成以上;接著將這些樂曲的歌詞綜合在一起,並以Python拆解成一個一個詞彙單元,並且將詞彙經過某些篩選(後述)之後,選出前100個最常被使用的詞彙。 在大量的詞彙之中,日本語助詞例如「て」、「に」、「を」、「は」,或是一些「太一般的詞彙」例如「こと」;由於話題性的原因,這些詞彙將會被略去 (參見動畫02:51-03:01處) 。最後選出的前100名之中,由於篇幅因素,這邊僅列出前10名。分別是: 1. 「君」、 2. 「僕」、 3. 「私」、 4. 「何」、 5. 「世界」、 6. 「今」、 7. 「あなた」、 8. 「手」、 9. 「心」、 10. 「見」。 《統計5,000首Vocaloid樂