当前位置:首页 >> 互联网 >> 2006年11月21日
"Times New Roman", Times, serif; align="center">数据:搜索引擎 七种使用者
推荐者:草根帮主 (积分 142071) | 原作者:
先前 AOL 說為了要給大家做研究, 就公佈了 65 萬個使用者 3600 萬筆搜尋資料, 當然這些資料有經過一些處理, 例如說使用者名稱被亂數編號取代 (但 同一個使用者用 同一個編號);很顯然 這件事相當地不妥, 他們 馬上出來道歉.
不過你 知道, 網路上多 無聊人, 而且這次 資料相當寶貴, "真實 人類活動”, 對於了解網路使用者 行為而言具有相當 重要性, 所以這份 log 一公佈, 馬上就被大家 "妥善” 地保存了起來, 除了有集中式 FTP / HTTP 下載點外, 有 BT / eMule 下載方法, 看情況 會永久流傳了 XD 當然啦, 無聊 學術人員不會只 把 log 拿出來看看就算了, 一定會有人去進行分析;果然一星期後 今天, 第一份分析結果終於出爐啦 :)
其實在之前已經有人找出過其中 某些編號 什麼人了 (例如說 New York Times 就找到了 No. 4417749), 或 從搜尋字詞中看出一個人心態 轉變 (例如說 No. 672368 從 "我懷孕了但 他不想要孩子” 到 "懷孕期間吃什麼比較好” 到 "Charlotte NC (北卡 某處) 墮胎診所” 到 "基督徒墮胎可以被寬恕嗎”);不過這次 分析 不一樣 , 這次 把所有這 65 萬個使用者依其使用搜尋引擎 行為分成七大類, 某種程度上來說, 你,或我, 應該 可以被歸到這七大類中.
第一類叫做 "Pornhound”, 沒錯, 就 搜尋情色相關資訊. 然後他們還發現, 這個族群還可以再粗分成兩個子群, 有一群 不管什麼時候都會搜尋情色相關資訊, 有一群 只有在某些特定時間才會搜尋情色相關;文中舉了一個 No. 190827 例子, 他在午夜前 搜尋都 些像 "笑話” 或 "詩” 之類 正常東西, 但 十二點一過就變成 "黃色笑話”,”和狗做愛 女孩” 這種 XD
第二類叫 "Manhunter”, 就 用搜尋引擎來尋人 . 根據分析, 似乎沒有出現 "長期追蹤某一個人” 現象, 大部份 搜尋都好像曇花一現, 集中出現在某一段時間, 然後就沒下文了, 他們 解讀 這些使用者可能 在做人事背景調查, 或者 在找失散多年 朋友.
第三類叫 "Shopper”, 購物前會先調查評價 就 這種人. 例如說他們發現 No. 3659741 在短短三天之內找了 37 次 "treo 700";大部份 人找 東西都還蠻實際 , 例如說找找 "coupons” 之類 東西.
第四類叫 "Obsessive”, 會一直重複搜尋某項資訊. 根據分析, 他們 搜尋頻率有點像 "A, A, A, A, B, A, A, C, A, D, A” 這樣, 一直無法忘情, 偶爾想到就會搜尋一下;而且, 這類使用者會使用比較精確 搜尋功能, 可以有效地減少亂槍打鳥 情況.
第五類叫 "Omnivore”, 雜食性動物. 他們什麼都查, 沒有什麼特定 分類趨向.
第六類叫 "Newbie”, 電腦新手. 怎樣判斷新手呢 ? 例如, No. 12792510 把 search box 和 URL line 搞混了, 一直在搜尋 "www.google”;還有些人在搜尋 字詞間沒有加空格隔開.
第七類叫 "Basket Case”, 無助 人 XD 這些人用電腦來抒發情緒, 他們 搜尋用詞都 一些像 "我討厭我 工作” 或 "為什麼我長得不好看” 之類 字句;另外他還舉了 No. 3696023 當例子, 這位仁兄寫了好長 一句 "i hurt when i think too much i love roadtrips i hate my weight i fear being alone for the rest of my life.”
[ 关键词:数据 搜索引擎 原文/来源链接 ]不過你 知道, 網路上多 無聊人, 而且這次 資料相當寶貴, "真實 人類活動”, 對於了解網路使用者 行為而言具有相當 重要性, 所以這份 log 一公佈, 馬上就被大家 "妥善” 地保存了起來, 除了有集中式 FTP / HTTP 下載點外, 有 BT / eMule 下載方法, 看情況 會永久流傳了 XD 當然啦, 無聊 學術人員不會只 把 log 拿出來看看就算了, 一定會有人去進行分析;果然一星期後 今天, 第一份分析結果終於出爐啦 :)
其實在之前已經有人找出過其中 某些編號 什麼人了 (例如說 New York Times 就找到了 No. 4417749), 或 從搜尋字詞中看出一個人心態 轉變 (例如說 No. 672368 從 "我懷孕了但 他不想要孩子” 到 "懷孕期間吃什麼比較好” 到 "Charlotte NC (北卡 某處) 墮胎診所” 到 "基督徒墮胎可以被寬恕嗎”);不過這次 分析 不一樣 , 這次 把所有這 65 萬個使用者依其使用搜尋引擎 行為分成七大類, 某種程度上來說, 你,或我, 應該 可以被歸到這七大類中.
第一類叫做 "Pornhound”, 沒錯, 就 搜尋情色相關資訊. 然後他們還發現, 這個族群還可以再粗分成兩個子群, 有一群 不管什麼時候都會搜尋情色相關資訊, 有一群 只有在某些特定時間才會搜尋情色相關;文中舉了一個 No. 190827 例子, 他在午夜前 搜尋都 些像 "笑話” 或 "詩” 之類 正常東西, 但 十二點一過就變成 "黃色笑話”,”和狗做愛 女孩” 這種 XD
第二類叫 "Manhunter”, 就 用搜尋引擎來尋人 . 根據分析, 似乎沒有出現 "長期追蹤某一個人” 現象, 大部份 搜尋都好像曇花一現, 集中出現在某一段時間, 然後就沒下文了, 他們 解讀 這些使用者可能 在做人事背景調查, 或者 在找失散多年 朋友.
第三類叫 "Shopper”, 購物前會先調查評價 就 這種人. 例如說他們發現 No. 3659741 在短短三天之內找了 37 次 "treo 700";大部份 人找 東西都還蠻實際 , 例如說找找 "coupons” 之類 東西.
第四類叫 "Obsessive”, 會一直重複搜尋某項資訊. 根據分析, 他們 搜尋頻率有點像 "A, A, A, A, B, A, A, C, A, D, A” 這樣, 一直無法忘情, 偶爾想到就會搜尋一下;而且, 這類使用者會使用比較精確 搜尋功能, 可以有效地減少亂槍打鳥 情況.
第五類叫 "Omnivore”, 雜食性動物. 他們什麼都查, 沒有什麼特定 分類趨向.
第六類叫 "Newbie”, 電腦新手. 怎樣判斷新手呢 ? 例如, No. 12792510 把 search box 和 URL line 搞混了, 一直在搜尋 "www.google”;還有些人在搜尋 字詞間沒有加空格隔開.
第七類叫 "Basket Case”, 無助 人 XD 這些人用電腦來抒發情緒, 他們 搜尋用詞都 一些像 "我討厭我 工作” 或 "為什麼我長得不好看” 之類 字句;另外他還舉了 No. 3696023 當例子, 這位仁兄寫了好長 一句 "i hurt when i think too much i love roadtrips i hate my weight i fear being alone for the rest of my life.”
|
|
[收藏至站内网摘] [ 'del','scrollbars=no,width=475,height=575,left=75,top=20,status=no,resizable=yes'));del.focus();">Del.icio.us收藏] [%22_blank%22,%22scrollbars=no,width=600,height=450,left=75,top=20,status=no,resizable=yes%22); void 0">百度搜藏] [抓虾 订阅] [鲜果 订阅] |
佩服分析者一次先!
厉害啊, 厉害啊!真 有意义 分析工作, 如果确定得到IP 话, 那岂不 有机会知道 谁在查什么了?
从事情报分析工作, 真 好!
顶一个呀8.250064E-02