国产乱人伦精品一区二区,国产在线麻豆精品观看,国产在线播精品第三,亚洲欧美国产制服动漫

您的位置：首頁>智東西 >

今日熱文：還能這么玩？清華給 ChatGPT 做逆向，發現了 ChatGPT 的進化軌跡！

來源：夕小瑤科技說 2023-05-08 15:30:30

夕小瑤科技說原創作者 |小戲、Python

立足一個 ChatGPT，現在對大模型的研究簡直是百花齊發百家爭鳴，用 ChatGPT 做化學實驗、給 ChatGPT 做心理測試、誘導 ChatGPT 越獄泄漏隱私、讓幾個 ChatGPT 形成一個小社會等等不勝枚舉。

(相關資料圖)

而最近，清華的研究團隊又在大模型研究中另辟蹊徑，不僅構建了一個數據集記錄 ChatGPT 隨時間的“版本迭代”，更是通過逆向分析探索得到了 OpenAI 對 ChatGPT 動的手腳做的改進，推演出了 ChatGPT 的進化軌跡！論文和項目地址如下：

論文題目：
ChatLog: Recording and Analyzing ChatGPT Across Time
論文鏈接：
https://arxiv.org/pdf/2304.14106.pdf
項目鏈接：
https://github.com/THU-KEG/ChatLog

首先讓我們來看一張圖，其實毋庸置疑，OpenAI 在 ChatGPT 如此龐大的用戶基數下，必然會借助這些海量的“優質數據”讓 ChatGPT 不斷的迭代進化。以 ELI5 數據集（包含很多 Explain Like I am 5 問題的數據集）為例，在 3 月 9 號的 ChatGPT 版本中，ChatGPT 只給出了一個相當簡陋的回答，很顯然 ChatGPT 在 3 月 9 號還沒有完全理解什么是“Explain Like I am 5”，但是在 4 月 9 號時，ChatGPT 已經完成了進化，不僅表達更加生動，甚至還使用了比喻的修辭。

顯然，一個直覺的問題是“ChatGPT 是沿著什么方向變化的？”，如果可以搞清楚這個問題，不僅是可以滿足一下我們的好奇心，更是給 ChatGPT 客觀的評估工作帶來了方便。但這個問題并不是 OpenAI 會寫在文檔里供我們即插即用的問題，因而，這篇工作應運而生，總的來說，論文完成了兩件事，一是分別構建了一個按日還按月記錄 ChatGPT 變化的數據集；二則是利用這個數據集對 ChatGPT 的進化軌跡進行了分析，得出了不少有意思的結論。

ChatLog——ChatGPT 進化數據集

關于數據集，作者團隊從兩個角度出來，一個是構建一個以月份為時間維度的數據集，一個是構建一個以日期為時間維度的數據集。對于按月記錄的數據集而言，作者團隊從數據集 HC3（一個包含大約兩萬四千條問題及其對應的人類專家答案和 ChatGPT 答案的數據集）、Jack of All Trades （一個用于評估 ChatGPT 在25個公共 NLP 數據集上的 25 個不同 NLP 任務性能的數據集）以及一系列其他數據集中抽取了涵蓋計算機、數學、金融等不同領域的共 38730 個問題-答案對，每月詢問一次 ChatGPT，構成 ChatLog-Monthly。

而為了監測 ChatGPT 每天的變化，論文從 HC3 數據集中隨機抽取了1000個問題，從 2023 年 3 月 5 日到 4 月 9 日重復發送給ChatGPT。其中有些問題是開放性的，可能需要 ChatGPT 借助外部知識，而有部分問題是分析性的，主要考驗 ChatGPT 的分析能力?？傮w大約 30% 是“What”類型的問題，30% 是“How”類型的問題，58% 是為“Why”類型的問題，其他類型的問題占 6%。通過在這些問題上 ChatGPT 的表現，可以評估它在多方面的表現，如多領域知識理解、推理、解釋等。

分析——ChatGPT 的進化軌跡

有了數據集，選取相應評價指標，便可以看出 ChatGPT 隨時間的進化軌跡。如下表所示，對比 1 月份的 ChatGPT 在不同任務數據集上的結果，可以看出 New ChatGPT 有了幾乎全線的提升。

總結來看，對比 1 月，ChatGPT 主要完成了以下的升級：

在攻擊性與垃圾文本分類任務中，New ChatGPT 有了顯著的提升，幾乎接近現有模型的 SOTA，這表明 ChatGPT 在識別攻擊性與垃圾文本的能力方面有了巨大的提升，這種提升很有可能是開放用戶的攻擊帶來的；對于需要數學推理的任務，ChatGPT 有了顯著的改進，在 MathQA 數據集上的準確率從 71.40% 提高到了 78.00%。

關注推理能力，從下面的圖中可以看出，3 月 5 號的 ChatGPT 使用了錯誤的推理得出來了錯誤的答案，但是在 4 月份，ChatGPT 的推理能力便完成了升級，已經可以正確的理解問題并加以推導并得到正確的答案。顯然，在 ChatGPT 這種進化速度下，如果沒有固定 ChatGPT 的時間版本，那么非常有可能因為忽略 ChatGPT 升級這一關鍵因素而得出錯誤的評估結果。

值得注意的是，在一些依賴先驗知識的任務中，ChatGPT 的性能發生了下降，如在 WNLI 數據集上，ChatGPT的準確率從 1 月份的 81.69% 下降到 71.83%。換言之，大量語料的涌入對 ChatGPT 而言有可能并不全然是一件好事，與人類的互動也會增加 ChatGPT 的機器幻覺。

而對 ChatLog-Daily 而言，這種變化可以被更加細致的可視化如下（后綴 p，r，f 分別表示精確度，召回率和 F1 分數）：

可以看到，ChatGPT 生成的答案正在變得更加簡潔，在追求精度與廣度的平衡，以獲得更高的可讀性。但是，單純分析這種準確率召回率，其實沒法真正透視 OpenAI 到底做了什么，這些指標也無法分析出為什么時隔一個月，ChatGPT 便學會用比喻來解釋問題了。因此，作者在這個基礎上更進一步做了全面的特征提取，具體而言，作者團隊將個 query 在天內持續丟給 ChatGPT，得到了維的回復矩陣，再對中每天的回復提取個特征（情感特征、知識特征、語言特征），構成集合。如下圖所示，作者利用對應不同的工具，提取出了知識、語言、情感等總計 265 個的豐富特征。

根據這些特征，作者探索了特征與對應得分之間的關系，可以看到，語義特征與召回率正相關與準確率負相關，結合前面 ChatLog-Daily 的分析結果，可以看出 OpenAI 在語義豐富度方面加強了 ChatGPT。

那么什么在快速迭代中，ChatGPT 的什么特征是穩定的呢？論文定義了一個特征穩定的評估指標——變異系數，公式如下：

其中，為特征的索引。通過在 ChatLog-Daily 上進行測試，可以看到最穩定的指標是可讀性與語義清晰度。也就是說，這幾個指標是 ChatGPT 做的最好的核心競爭力。

總結與討論

總的來說，這篇論文從 ChatGPT 時間變化性這個角度切入去深入的了解了 ChatGPT 所關注的特征，并且也關注到了 ChatGPT 特征的動態變化，這為許多基于 ChatGPT 的探索性研究鋪了一條方便的道路，也或多或少規避了一些因為 ChatGPT 的進化而不應該得出的錯誤結論。

關鍵詞：

最新文章

2023-05-08 15:30:30 今日熱文：還能這么玩？清華給 ChatGPT 做逆向，發現了 ChatGPT 的進化軌跡！
2023-05-08 14:47:41 【新要聞】gathered around_gathered
2023-05-08 14:34:21 網名格式(網名指在網上使用的名字)
2023-05-08 13:52:12 【世界時快訊】StudioGAON將混凝土倉庫改造成夫婦的第一所房屋
2023-05-08 13:18:56 當前速看：步千凡

傳感物聯網

還在苦苦尋找優秀經典的名言嗎？為大家整理的關于法律的名言警句

關于法律的名言警句(精選220句)在日常學習、工作或生活中，大家都有令自己印象深刻的名言吧，巧用名言有助于我們正確對待學習、生活、成長
怎樣寫方案才更能起到其作用呢？整理的項目合作實施方案

項目合作實施方案5篇為保證事情或工作高起點、高質量、高水平開展，往往需要預先進行方案制定工作，方案指的是為某一次行動所制定的計劃類
楚辭影響最大的作品《離騷》全文對照翻譯

《離騷》全文對照翻譯《離騷》是屈原的代表作，創作于楚懷王時期屈原遭讒被疏之時，是楚辭影響最大的作品。下面是《離騷》全文對照翻譯...
寫申請書時理由總是不夠充分？為大家整理的退學申請書

退學申請書(精選12篇)在一步步向前發展的社會中，申請書在現實生活中使用廣泛，申請書不同于其他書信，是一種專用書信。寫申請書時理由總是
都有哪些類型的話語呢？為大家收集的感恩老師的話精選150句

感恩老師的話在生活、工作和學習中，越來越多人喜歡發表話語，話語是特定社會語境中人與人之間從事溝通的具體言語行為。那么都有哪些類...

国产乱人伦精品一区二区,国产在线麻豆精品观看,国产在线播精品第三,亚洲欧美国产制服动漫

亚洲午夜视频| 影音先锋中文字幕一区| 亚洲欧美另类久久久精品2019| 亚洲国产裸拍裸体视频在线观看乱了| 欧美激情1区2区| 欧美成人精品1314www| 久久成人av少妇免费| 久久在线视频在线| 一本色道久久88综合日韩精品| 亚洲天堂成人| 欧美亚洲视频在线观看| 欧美69视频| 久久视频国产精品免费视频在线| 国产亚洲女人久久久久毛片| 亚洲午夜精品久久久久久浪潮| 亚洲小说区图片区| 激情文学一区| 国内精品久久久久久久影视麻豆| 99这里只有久久精品视频| 99综合电影在线视频| 狠狠色丁香久久婷婷综合_中| 美女黄色成人网| 亚洲午夜未删减在线观看| 欧美日韩久久久久久| 国产精品推荐精品| 久久久亚洲午夜电影| 亚洲女性裸体视频| 国产精品极品美女粉嫩高清在线| 欧美视频一区二区三区…| 一区二区在线视频播放| 欧美专区日韩专区| 韩国女主播一区二区三区| 性欧美暴力猛交另类hd| 日韩视频专区| 国产一二精品视频| 国产精品久久久一本精品| 亚洲女人天堂av| 欧美日本一道本在线视频| 亚洲三级电影全部在线观看高清| 亚洲国产一区二区三区在线播| 亚洲国产精品国自产拍av秋霞| 在线观看不卡av| 欧美性大战久久久久久久蜜臀| 欧美中文字幕在线视频| 美女国内精品自产拍在线播放| 亚洲综合电影一区二区三区| 亚洲精品自在在线观看| 99国产一区二区三精品乱码| 欧美成人一区二区三区片免费| 久久亚洲二区| 久久精品国产清自在天天线| 欧美成人在线免费视频| 欧美高清自拍一区| 在线观看的日韩av| 国产欧美精品xxxx另类| 午夜亚洲影视| 欧美影片第一页| 亚洲国产婷婷| 亚洲国产黄色片| 日韩一区二区精品视频| 伊人成人开心激情综合网| 欧美黄色免费| 国产亚洲欧美日韩美女| 欧美自拍偷拍| 亚洲自拍另类| 国产综合色一区二区三区| 一区二区三区欧美亚洲| 欧美激情2020午夜免费观看| 国产精品色网| 在线观看精品一区| 欧美午夜精品久久久| 国产欧美一区二区视频| 久久精品在线免费观看| 亚洲性视频h| 亚洲一区视频在线观看视频| 欧美在线影院在线视频| 亚洲婷婷免费| 欧美一区二区日韩一区二区| 欧美视频中文字幕在线| 在线高清一区| 欧美一区二区在线观看| 中文日韩电影网站| 久久免费高清视频| 欧美日韩日日夜夜| 欧美日本一区| 国产精品久久福利| 亚洲一区精品视频| 国产精品v欧美精品v日本精品动漫| 国产精品久久久久av| 欧美不卡视频| 欧美性片在线观看| 欧美日韩精品中文字幕| 国产精品久久久久99| 亚洲激情小视频| 亚洲精品一区二区在线| 国产精品久久久久久久久久免费| 美女日韩欧美| 亚洲黄色免费网站| 亚洲免费观看在线观看| 久久人人爽国产| 亚洲欧美综合v| 免费看黄裸体一级大秀欧美| 亚洲成人原创| 欧美国产精品久久| 欧美视频中文一区二区三区在线观看| 国产精品网站在线观看| 久久午夜国产精品| 亚洲精品国产拍免费91在线| 国产精品高精视频免费| 亚洲天堂网站在线观看视频| 亚洲欧洲一区二区在线观看| 欧美大尺度在线| 亚洲区在线播放| 欧美国产高清| 亚洲字幕一区二区| 欧美午夜一区| 欧美精品成人在线| 美女爽到呻吟久久久久| 国产精品一区二区久久久| 亚洲欧美日韩人成在线播放| 欧美久久精品午夜青青大伊人| 亚洲久久视频| 亚洲日本免费| 欧美夫妇交换俱乐部在线观看| 亚洲精品免费在线播放| 欧美性大战xxxxx久久久| 久久久爽爽爽美女图片| 午夜精品久久| 亚洲欧洲综合另类在线| 一区二区三区视频在线观看| 欧美在线观看视频在线| 欧美一区在线看| 久久久女女女女999久久| 亚洲欧洲偷拍精品| 久久久www成人免费无遮挡大片| 欧美在线网站| 亚洲精品在线三区| 麻豆91精品| 久久激情五月激情| 国产欧美亚洲日本| 欧美一区二区三区精品| 欧美日韩八区| 久久综合九色欧美综合狠狠| 亚洲人成绝费网站色www| 欧美日韩在线一区二区三区| 亚洲人成人一区二区三区| 欧美日韩一区二区三区四区五区| 亚洲午夜久久久久久尤物| 一二三区精品| 欧美日韩国产综合视频在线| 亚洲网站在线观看| 欧美精品一区二区三区蜜桃| 欧美一级片久久久久久久| 国产精品久久久久久久久久妞妞| 国产综合婷婷| 在线精品亚洲一区二区| 国产伦精品一区二区三区高清| 精品动漫3d一区二区三区免费版| 欧美天堂亚洲电影院在线播放| 免费一级欧美片在线播放| 欧美日韩日日夜夜| 欧美日韩午夜激情| 亚洲天堂av在线免费| 欧美午夜片欧美片在线观看| 国产一区二区三区久久| 一区二区亚洲| 欧美日韩高清在线播放| 一区二区三区四区国产精品| 美国十次了思思久久精品导航| 久久在线免费观看视频| 欧美国产日本高清在线| 日韩一级不卡| 蜜桃av噜噜一区二区三区| 欧美乱在线观看| 国产精品日韩欧美综合| 欧美日韩国产免费| 在线不卡中文字幕播放| 午夜精品久久久久久久99黑人| 亚洲美女一区| 99精品欧美一区二区三区综合在线| 亚洲欧美日韩国产中文| 亚洲国产精品欧美一二99| 欧美一区二区三区男人的天堂| 国产精品午夜春色av| 亚洲经典视频在线观看| 国产日韩三区| 国产日韩一区二区| 久久精品在线播放| 国产综合一区二区| 日韩亚洲精品视频| 午夜欧美大片免费观看| 欧美亚洲成人免费| 欧美日韩国产精品一卡| 国产香蕉久久精品综合网| 一区二区三区在线观看视频| 欧美在线看片| 亚洲最新视频在线播放| 国产日韩欧美另类| 精品动漫一区| 亚洲精品影视在线观看|