可拉伸英語單詞聽說過嗎?

加拿大都市网

對Twitter上的內容進行的分析,揭示了人們如何使用可拉伸詞(如「 duuuuude」,「 heyyyyy」或「 noooooooo」)。伯靈頓佛蒙特大學的Tyler Gray和同事在2020年5月27日的開放獲取期刊PLOS ONE中公布了自己的研究成果。

在口語和書面語中,延伸的單詞可以修改單詞的含義。例如,「suuuuure」可能表示諷刺,而「yeeesssss」可能表示興奮。 延伸的單詞在正式寫作中很少見,但是社交媒體的興起為它們提供了新的機會。

Gray和他的同事現在已完成了迄今為止針對社交媒體中「可拉伸」單詞現象的最全面研究。他們開發了一種新的、更徹底的算法來識別推文中的拉伸單詞,並使用它來分析隨機選擇的數據集,該數據集約佔2008年9月至2016年12月之間產生的所有推文的10%,總計約1000億條推文。

研究人員在推文中識別出數千個「可拉伸」單詞,包括「ha」(例如「 haha​​ha」或「 haaahaha」),「awesome」(例如「 awessssommmmmeeeeeeee」)和「goal」(例如ggggoooooaaaaallllll)。

他們還確定了衡量可伸展單詞特徵的兩種關鍵方法:平衡和伸展。平衡是指不同字母傾向於重複的程度。 例如,「 ha」具有很高的平衡度,因為在拉伸時,「h」和「a」傾向於幾乎相等地重複。 「goal」的平衡性較差,「o」重複的次數更多。

伸展度是指一個單詞傾向於被拉多長。例如,簡短的單詞或聽起來像「ha」的擬聲詞具有很高的延伸度,因為人們經常重複多次(例如「哈哈哈哈哈哈哈哈」)。 同時,「infinityyy」之類的常規詞的拉伸程度較低,通常僅重複一個字母。

為了進行分析,研究人員開發了用於可拉伸單詞研究的各種工具和方法,例如對錯誤鍵入和拼寫錯誤的篩選。該工具還可用於改善自然語言處理,搜索引擎和垃圾郵件過濾器

作者補充說:「我們能夠全面收集和計算’gooooooaaaalll’和’hahahaha’這樣的拉伸詞,並在總體拉伸性和拉伸平衡的兩個維度上進行映射,同時創造了新的工具,將有助於後續研究的持續發展;並輻射到語言研究,以及其他領域,例如語言處理,擴充詞典,改進搜索引擎,分析序列的構造等等。」(煎蛋,圖片來源pixabay)

share to wechat

延伸阅读

延伸阅读

多伦多Home Depot等大型商店最新优惠传单

刚刚官宣!凯特王妃明天公开出席活动:我还没有脱离危险

怡陶碧谷凶案32岁男子被控谋杀九旬祖父!

如何判断你的手机是否被黑客攻击?