This page looks plain and unstyled because you're using a non-standard compliant browser. To see it in its best form, please visit upgrade to a browser that supports web standards. It's free and painless.

工程師級的顧問 / 【食夢黑貘】 會員登入 會員註冊

« 上一篇 | 下一篇 »

[QOTD]我一直希望有人能夠做, 但看樣子這樣的文明
進程是很難等的.

前天晚上一直在思索如何做一個輔助人閱讀Blog
的系統, 當然這問題可大可小, 從一個可以讓人登錄
的 Directory Service 到當時一直想做的自動文摘
系統都是實踐的方法.


就 Blog 的觀點來看有幾個很重要的項目:

1. 這個Blog的文章量與質.
主要就是發文頻率, 文章字數, 以及自撰比例.

2. 這個Blog的文章內容與分類.
主要就是主題, 分類.

3. 這個Blog的閱讀行為.
包含瀏覽數, 回應數, 引用數.

4. 這個Blog的關系.
Blog之間的距離, 跟讀者的距離.

當然 RSS 能夠做到的大概只有發文頻率是最直接
的, 而文章字數, 回應數, 引用數都不難做到, 剩下
的幾個指標就有點挑戰了.

所以 We!Blog 計劃基本上就有點雛型了.

1. 轉址: 使用者登錄為優先, 不然會自動尋找幾個
常用的Blog 來比對, 依第一次使用時前五
篇文章總天數來擇其對應.

2. 追蹤: 追蹤這個Blog的發文狀態, 平均多久發一
次文章, 及最近一星期與一個月的發文數.

3. 字數: 也是以週與月為單位的記錄及平均.

4. 引用: 這個應該是很重要的指標, 大概只能祭起
狐狗大神來幫忙, (現在叫狐狗改名為很像
做玩具的 "美商科高股份有限公司").

5. 訂閱: 當然讓使用者做一個基本的篩選是有必要
的, 基本的分類與閱讀次數.

6. 回應: 這個就會稍為複雜一些, 但不是困難完成
且有價值的.

第一階段到這邊就差不多了, 因為接下來的距離
與分類等等, 甚至判斷是不是別人的文章, 都不是簡
單的, 那個說不定是要到第三階段完成, 第二階段應
該是做第一階段時想到的功能.

當然很多事情須要有個東西叫分類, 現在說要抓
一篇文章來判斷其分類這樣的系統是很大的挑戰但也
是最基本的功夫, 因為若是這個沒做的話, 很多計劃
都無法下去, 看樣子我若有機會應該做一個這樣的系
統開放出來, 會對大家幫助很多.

或許 ODP 在這樣的計劃幫忙的上, 或不行, 但
有可能是一個方向與可能性, 當然自然輸入法詞庫也
是一個很重要的事, 但若有名詞的分類表是最直接且
有效的, 當然這也包含名詞的轉譯, 關係, 從屬, 別
名, 簡翻, 俗名, 縮寫等等各式各樣的挑戰, 我一直
希望有人能夠做, 但看樣子這樣的文明進程是很難等
的.

發表回應

 暱稱 (必填)

 標題

 個人網頁

 電子郵件

authimage 
 認證碼 (必填)