【軟件新】WordStat 2022 新功能新特性

wordstat 2022 版有哪些新功能?我們很高興推出 wordstat 2022。從 wordstat 9 到新版本 wordstat 2022(以及新版本號方案)意味著快地引入每年發(fā)布一次的新功能,而不是每 2 或 3 年發(fā)布一次,并且很可能甚至每年不止一次。
新的 wordstat 2022 實現(xiàn)了幾個重要的功能,雖然沒有以前的主要版本那么多,但我們認(rèn)為它們具有重要意義,特別是對于開發(fā)分類模型、分類法或詞典。
1. 高度優(yōu)化的主題建模與因素分析在 wordstat 2022 中,我們實施了一個新的多線程因素分析例程,比以前的版本快 65 倍。這意味著現(xiàn)在可以在不到一分鐘的時間內(nèi)解決需要一個小時計算的大型問題。我們還能夠?qū)⒁蛩胤治鋈萘吭黾拥?10,000 個單詞(之前版本為 3,000 個)。
我們自己的研究工作表明,與依賴 lda 和神經(jīng)網(wǎng)絡(luò)技術(shù)的主題建模技術(shù)相比,使用因子分析的主題建模產(chǎn)生的主題解決方案加連貫和多樣化(peladeau & davoodi,2018 年;peladeau,2022 年)。它還具有穩(wěn)定性的額外好處,每次都會產(chǎn)生相同的結(jié)果。然而,它的主要不便一直是它的速度和容量。這使我們在 wordstat 8 中實現(xiàn)了一個使用非負(fù)矩陣分解(或 nmf)的特殊主題提取例程。這種技術(shù)可以地產(chǎn)生結(jié)果,這些結(jié)果與使用因子分析獲得的結(jié)果非常相似。然而,它的概率實現(xiàn)會導(dǎo)致每次運行的結(jié)果略有不同,這讓一些研究人員感到有些不安。重要的是要注意,計算機科學(xué)中幾乎所有其他流行的主題建模技術(shù)產(chǎn)生的主題解決方案甚至比我們自定義的 nmf 實現(xiàn)不穩(wěn)定。那些尋求佳和穩(wěn)定的主題解決方案的人可能會喜歡新的因素分析主題建模例程的速度和容量大大提高。
2.改進了頻率頁面上的建議wordstat 早期版本中的“建議”面板顯示同義詞庫可用的語言的同義詞、反義詞和相關(guān)詞。它還提供了以相同首字母開頭的單詞,使人們能夠識別一些拼寫錯誤以及相關(guān)的單詞。一個新的關(guān)聯(lián)詞部分現(xiàn)在從文本語料庫中檢索與頻率表中所選詞在語義、句法和統(tǒng)計上相關(guān)的其他詞。這個新功能應(yīng)該適用于任何語言。默認(rèn)情況下,條目將按相關(guān)性降序排列。同義詞、反義詞和相關(guān)詞也會按照相關(guān)性降序排列,便于識別合適的建議。人們?nèi)匀荒軌虬醋帜疙樞蚧蝾l率降序?qū)@些條目進行排序。此外,一個新的頻率過濾選項可以讓人們過濾掉低頻建議,讓人們專注于頻繁的建議。
由于這種提取相關(guān)詞和排序建議的新方法與語言無關(guān),因此對于分析沒有詞庫的語言的人來說尤其有用。然而,我們發(fā)現(xiàn),即使有這樣的語言資源,基于單詞上下文使用的額外建議,以及根據(jù)相關(guān)性對現(xiàn)有同義詞和相關(guān)單詞進行排序,也應(yīng)該較大地促進適當(dāng)項目的識別。
3. 短語提取例程的新建議選項卡。重疊面板已替換為建議面板,除了重疊短語外,還顯示與短語頻率表中所選行在語義、句法或統(tǒng)計上相關(guān)的短語。此功能也與語言無關(guān)。
4. 命名實體識別的改進。命名實體識別頁面中添加了一個新的相關(guān)面板。選擇單個命名實體將帶來相關(guān)的命名實體,以及屬于同一類(人、地點、組織等)的命名實體。選擇一個特定類別的多個示例(例如,多個城市)也將檢索屬于該類別的多項目。上下文菜單還允許將任何項目移動到分類詞典或排除列表中。還可以對選定的建議執(zhí)行上下文中的關(guān)鍵字搜索。
5. 上下文關(guān)鍵詞表中上下文詞的**顯示。在評估分類詞典中的詞或候選詞時,通常需要查看在目標(biāo)詞或短語出現(xiàn)的上下文中是否存在其他關(guān)鍵字。一種新的**顯示功能允許人們*要在單詞的周圍上下文中查找的單詞和短語列表。當(dāng)從主題建模或樹狀圖中調(diào)用 kwic 列表時,或者在評估包含多個條目的內(nèi)容類別中的項目時,會自動填充此列表。
6.根據(jù)頻率或距原點的距離過濾對應(yīng)圖中的項目。過幾百個項目的對應(yīng)圖可能會在圖的中心(原點)創(chuàng)建一大堆重疊的項目。添加了一個新的滑塊控件以隱藏不太頻繁或接近此原點的項目。除非有人想確定一個自變量的所有類的共同點,否則有趣的項目是那些遠(yuǎn)離原點的項目,因為它們是不同類的特征。過濾掉這些項目可以讓人們?nèi)菀椎刈R別不同的項目。
7.改進關(guān)鍵字檢索關(guān)鍵字搜索的結(jié)果現(xiàn)在按相關(guān)性降序排列,同時考慮匹配項的頻率和種類與檢索到的文本段的長度的關(guān)系。新的頻率列也可用于僅按頻率排序。
8. 通過連接計算字符串變量一種新的數(shù)據(jù)轉(zhuǎn)換命令允許人們通過連接幾個現(xiàn)有變量(數(shù)字、字符串、日期等)的值以及鍵入的文本來計算字符串變量。這樣的過程也可用于用常量字符串值初始化字符串變量。
9.持久對比圖設(shè)置這些比較圖表的圖表類型和統(tǒng)計數(shù)據(jù)以及調(diào)色板現(xiàn)在鏈接到變量名稱并存儲在項目設(shè)置中。這些選項應(yīng)該跨頁面(頻率、短語、主題建模、樹狀圖等)和會話之間保持不變,從而減少不斷重新調(diào)整這些選項的需要。
軟件鏈接:
//www.uone-/wordstat.html
北京友萬信息科技有限公司專注于minitab,stata,spss等, 歡迎致電 18600528290

樂泰loctite3342結(jié)構(gòu)膠 耐高溫抗沖擊防潮磁鋼粘接

牛排包裝機型號-山東康瑞達-牛排包裝機

滁州*氣體*-聲譽良好-合肥圣辰

乘客電梯-太原乘客電梯價格-太原合興永達電梯(推薦商家)

南京石塑地板-石塑地板廠商-凱玥建材(推薦商家)

DL-SWS6手持式生物毒性檢測儀

大廈人臉識別一體機生產(chǎn)廠家-華瑞電子質(zhì)量過硬

包裝箱數(shù)控鋸-包裝箱數(shù)控鋸價格-安泰明佳數(shù)控(誠信商家)

高速噴射點膠機定制廠家-鑫華-變壓器粘接灌封高速噴射點膠機

宜春安全體驗館-合肥佳新源|效果逼真-vr建筑安全體驗館

主站蜘蛛池模板: 国产人妖cdmagnet| 国产高清一区二区三区视频| 亚洲AV成人无码网站| 精品国产日韩亚洲一区二区| 国产精品ⅴ无码大片在线看 | 免费看美女被靠到爽的视频| 国产露出调教91| 大象视频在线免费观看| 久久久亚洲欧洲日产国码农村 | 亚洲精品无码乱码成人| 车上做好紧我太爽了再快点| 国产精欧美一区二区三区| 中文字幕乱妇无码AV在线| 樱桃视频高清免费观看在线播放| 免费人成在线观看网站品爱网日本 | 91麻豆精品福利在线观看| 手机小视频在线观看| 亚洲va在线va天堂va不卡下载| 精品久久久影院| 国产在线精品一区二区不卡| 97在线公开视频| 小sao货水好多真紧h视频| 久久久久琪琪去精品色无码| 欧美成人性色xxxxx视频大| 免费无码专区毛片高潮喷水| 青娱乐国产精品视频| 国产精品va在线观看无码| www.99re6| 日本亚洲欧美在线视观看| 亚洲一区二区三区国产精品无码| 狠狠97人人婷婷五月| 四虎永久免费地址ww484e5566 | 国产精品乱码久久久久久软件| 一个人hd高清在线观看免费直播| 日本高清免费不卡在线播放| 亚洲国产成人精品无码区在线观看| 精品处破视频在线观看| 国产又爽又黄无码无遮挡在线观看| 12一15女人a毛片| 大香网伊人久久综合网2020| 不卡av电影在线|