This page looks plain and unstyled because you're using a non-standard compliant browser. To see it in its best form, please visit upgrade to a browser that supports web standards. It's free and painless.

工程師級的顧問 / 【食夢黑貘】 會員登入 會員註冊

這篇文章是一開始就想寫了, 但剛要準備下筆的時候, 發現剛好 ITHome 也發了一篇文章, 所以這部份我不用著墨太多, 只是我這篇文章是要幫大同的同仁解釋為甚麼會出現這樣的問題, 以及幫他們說話.

 

事實上當我一看到這網站, 我心裏的 OS 就是 "慘了, 又是找了一群很會寫專案與軟體的人來作網站" 的一個案例, 當然這個專案應該是成功的, 因為就專案而言, 就是讓業主非常滿意的交付尾款, 而就軟體流程控管而言, 就是將每一個都能夠實作的不錯, 即使這個系統一開始規劃的流程可能是錯的...

 

 (閱讀全文)

回到 IT 部落格也一個月了, 但事實上只寫幾篇外, 目前是在附上我前一陣子鐵人賽的文章, 看樣子這樣一貼也要一兩個月才行, 這時來回顧一下這個部落格的狀況...

 (閱讀全文)
[這是10/29寫的] 這篇真的放了超過一個星期想寫沒寫, 甚至原先只是想要 "叫叫" 而已, 但在構思之後也作了個推論的結論, 所以也是種小公告...

[這是現在寫的] 過了幾天, 想法又變了很多, 但有些東西是不變的....


許多人找我寫噗浪機器人, 最後都被我說除非你能想出個我認為合理的 "有差別及有限量" 的方法, 不然我都會挽拒, 所以到現在還沒有幫任何人寫噗浪機器人, 說不定短時間也不會有, 畢竟我這 "假道學" 已經做的很累了....

事實上這篇的公告是:
以後推噗通知, 噗浪討論串, 必須加入機器人系列好友, 如 http://www.pug.tw/ 的 Plurk Usage Geek 一樣, 不會主動的去發送訊息.
 (閱讀全文)

這次在部落格觀察官方部落格公 布有 6 分以上的部落格, 事實上是不包含 pixnet 舊網址的, 有人在問為甚麼, 這答案有人以為是否是 pixnet 舊網址已經失效的關係, 事實上不是, 因為在轉址的情型下, 舊網址會跑出新網址或舊網址首頁的 pagerank 分數, 所以會看到一大堆 5 分或 6 分的部落格, 當然這才是失效的分數, 而不是去考慮網址失效...

但這次 PageRank 的變動, 最可怕的不是 Pixnet, 而是無名, 大家還記得前一陣子無名改文章網址的事吧, 或許是 Google 不喜歡這種騙 PageRank 的事, 所以一堆無名知名部落格的 PageRank 紛紛落馬:

Amykaku, 西喜從 4 分變 2 分
獵豹從 4 分變 1 分
曲窩, 奈奈, 銀娟, 馬小九, 九把刀等更從 4 分變成 0 分..

這些意外的跌落, 唯一的解釋不是有人 SEO 做得太過份, 想當然而應該是無名造成的問題, 只是是否是因為網址改變關係造成的不得而知, 但事實上有四個無名的部落格分數還是有前進的, 例如:

1. 想破頭狂想曲
2. 我很乖所以請聽我說
3. 最近
4. 愛司紀行

都 逆勢成長 2 分以上, 事實上在目前探知得部落格中, 從原本 2 分以上上升 2 分以上的只有 22 個部落格, 而跌落超過 2 分的有 514 個, 其中有 450 個更是變成 0 分, 但不能因此說這次是跌多漲少, 因為目前超過 5 分的已經有 216 個部落格且陸續增加中, 在七月的變動後統計, 當時才只有 102 個, 而這次是估計會有 300 個以上的部落格 Pagerank 會到達 5, ....

只是我的部落格還是只有 3 分, 4 分, 大概是真的沒人在看, 在連...

我 剛去 funp 看了一下, 我大約要寫到 30 篇左右才會被人推, 不像是知名部落客可以篇萹至少有 30 個人推, 我的記錄是 36 篇, 而上一篇被 BillyPan 破功, 停在 29 篇沒被推, 但剛好也是距離 30 篇啦, 雖然我的 feedburner 計數上應該不至於沒人看才對, 只是無奈不會有人推這是事實~~~~

但我會這麼說就是 PageRank 本來就只是一種觀點與指標, 甚至我在講網站經營有關 SEO 部份, PageRank 大概是第 5 項到第 10 項的影響因素, 甚至就實務經驗, 這的確不是在前三項重點因素, 只是這是一個較容易看到的指標, 甚至是唯一看得到的指標, 所以才會這麼重要吧...

拉回來題目, 我相信無名一點都不擔心, 因為他們掌握著 Yahoo 的資源, 那裏管得著 Google 的 PageRank, 這才是重點吧...

雖然所謂說就 Alexa 的排名來看, 雖然這批 新台灣 Web 2.0 的排名目錢都很難突破 200 名大關, 目前有 4 個網站算是領先群, 甚至互有領先, 而接下來的 33 個也是互有領先, 但幾乎都是一群群的很難突破, 所以即使有所名次交換也是在群組之內, 那我們來看到底可以分那些族群呢?

A 群: 200~400 名
地圖日記, funP, iPobar, 成份分析產生器

B 群: 500~800 名
愛評網, SiteTag, 好好搜, CrazyVote

C 群: 900~1200 名
iKaLa, DigGirl, 作自己的算命師, HemiDemi

D 群: 1500~2300 名
抽獎達人, 部觀門, FindBook, 嘻迷派對, 部落格觀察, 公民新聞, 幸福點點名

E 群: 2700~5000 名
MyIcon, 麻蛙, 巴布, 15Fun, iSwii, 訂便當, 羽毛, 米亞

F 群: 5600~6500 名
未來事件交易所, 宅度計, iReading, VeryXD(含其他), 場地王, 貼紙串連

目前列出 33 名在台灣名次破 6500 名的 Web 2.0 網站, 而第 34 個部落格軌道我想應該很快就會進到 F 群, 而貼紙串連也是在目前 A 到 F 群中, 最有可能離開自己群組的網站, 從這邊可以看出幾點...

1. 網站往往有時在定位就決定規模
2. 網站很難擺脫定位後的排名族群 (這點跟第一點很像)
3. 網站經過經營成長不易 (這點也跟第一點很像)
4. 網站帶出來的網站, 也不會脫離既有的框架 (這點跟第一點也很像)

說來說去, 還是只有一點, 若不是大變革, 一個網站說要有大躍進是很難, 但要退步的話, 反倒沒那麼難, 只是這點聽起來很殘酷, ....

這邊的原始資料是來字於 w2o, 我也 dump 出目前得資料在下方...

名次 網站 Alexa
Taiwan
Taiwan
Rank
Google
Trend
Blog
Look
1地圖日記
完整意見
247
(18558)
3130110004044
2funP 推推王
完整意見
298
(18907)
85260005190
3ipobar
完整意見
311
(38295)
070501858
4成份分析產生器
完整意見
391
(51793)
05300382
5iPeen 愛評網
完整意見
568
(52637)
59362504438
6SiteTag
完整意見
620
(48326)
157552503367
7好好搜!
完整意見
677
(53538)
215830002363
8Crazy Vote
完整意見
729
(82664)
017502271
9iKaLa
完整意見
971
(106165)
00308
10diggirl.net美女相簿
完整意見
1037
(52119)
1048108502816
11做自己的算命師
完整意見
1135
(65832)
180753200442
12HEMiDEMi
完整意見
1198
(76599)
30355004647
13抽獎達人
完整意見
1541
(149740)
001691
14部觀門
完整意見
1552
(96326)
53303631
15Findbook
完整意見
1592
(100761)
503672004857
16嘻迷派對
完整意見
1662
(137485)
344502403
17部落格觀察
完整意見
1858
(108419)
63100004365
18公民新聞
完整意見
2009
(181322)
033003590
19幸福點點名
完整意見
2254
(192221)
001491
20MyICON
完整意見
2780
(227623)
29803263
21麻蛙 2.0
完整意見
3026
(258814)
206203854
22巴布
完整意見
3114
(193381)
113934493886
2315Fun 一窩蜂
完整意見
3302
(238716)
1011401717
24iswii 美妝新聞台
完整意見
3551
(252984)
002640
25訂便當
完整意見
3795
(354263)
002162
26羽毛
完整意見
4588
(359620)
002876
27米亞
完整意見
5075
(259065)
00641
28未來事件交易所
完整意見
5618
(346461)
001719
29宅度計
完整意見
5703
(737658)
2347902420
30iReading你最愛的書
完整意見
6193
(423681)
003012
31VeryXD 2.0
完整意見
6224
(676094)
001756
32場地王
完整意見
6278
(852008)
00241
33貼紙串連
完整意見
6401
(1464662)
001851
34部落軌道
完整意見
9293
(1399369)
001092
35癮科技 PK
完整意見
13644
(1202241)
140201542
36MyZilla
完整意見
16471
(814568)
002745
37TaiwanRank
完整意見
21145
(852134)
001565
38你我的小城市
完整意見
29051
(1168326)
1234301185
39w2o.tw觀察表
完整意見
30560
(1951900)
00843
40熱門菜單
完整意見
39419
(1760513)
002248
[前言]雖然點閱數是最簡單且不會有問題, 只是人氣
與內容好壞並沒有絕對正比等等的議題這還是
存在的.

當我寫完對 SEO 的人投降後, 一些紛爭反而沒有
停止, 只有更多, 但至少在我心理而言, 是有打算告
一段落了, 畢竟這個也是有點近乎意識型態之爭,
包含對部落格觀察排行榜的質疑.

雖然我是希望部落格排行榜是有參考的價值,
但說要只靠外部使用的方式, 來衡量部落格的內容與
價值, 是蠻困難的, 只是有關內容好壞的部份, 目前
已經有中時電子報在做了, 而 Meta-Data 的部份也
很難衡量, 所以只好依 Usage 來作區分.

當然討論到最後, 除了內容好壞無法判斷外,
且又排除部落格觀察的奇怪分數來源外, 唯一的方法
就是點閱數與人次了, 只是這個在一開始是被排除,
畢竟點閱數是無法被外界計算, 除非他自己有意願去
公開.

而部落格觀察的貼紙, 事實上一直有在記錄與計
算點閱數, 但並沒有放進排行, 也不太可能放進排行,
因為不是每一個部落格都有放貼紙的, 但目前而言,
部落格觀察的貼紙覆蓋率可以說是最高的情型下,
若不跳出來提供這個讀者導引也是很奇怪.

在前天晚上, 跟熊瓶討論很久, 他說到那些 SEO
想要證明的不只是國外排行榜沒有價值, 更想證明部
落格觀察也沒有參考價值, 可能點閱數或許有機會讓
他們有所心服一點.

只是我不願意做的原因, 包含每一個部落格屬性
都不一樣, 造成的點擊率也會差很多, 若是都放在一
起也是很奇怪, 甚至若點擊數的排行榜真的被重視了,
可能我們要花很多精力去保障作弊的問題, 畢竟連
SEO 都可以作弊了, 點閱數更不是問題.

當然部落格觀察在 "熱門菜單" 就提供一些由點
閱數所導引的數字, 但都是以單一天為主, 而這個變
化真的很大, 畢竟不是每一個部落格每天都會有新文
章的, 所以若真的要看一個穩定的排行, 就必須看平
均數.

但平均數很容易被網摘, 放首頁, 摩人, 新聞報
導等等因素被幾天暴高, 幸好部落格觀察很早就有用
迴歸來算一個部落格的成長, 此時就派得上用場了,
而不再是一個會被幾天暴量所影響的數字了.

除此之外, 或許還是要用既有的平均數或中位數
提供目前大家在用, 即使變化很大的數字也無仿,
畢竟有變動的數字才會有所價值...

在黑貘來說曾提到最近會提供一個 "好讀指數"
來作系統使用, 畢竟排行榜的觀點還是很有限, 而往
往在列表時, 只有一個部落格觀察排名或指數是唯一
的參考是不足的, 更希望有一個包含發文數, 字數,
點閱數等等的比部落格觀察更多元的指標出現.

可惜在做 "好讀指數" 並不是所有資料都可以被
抓到, 所以這個挑戰更大, 因為必須算出一個平衡點,
在即使有些數字無法取得時必須推估出一個數值來用,
這個系統最可怕的是要一直做調整.

當然點閱數是最簡單且不會有問題的, 只是人氣
與內容好壞並沒有絕對正比等等的議題這還是存在的,
只是在未來部落格觀察會不會真的在排行榜附注點閱
數的名次, 這樣的歷史資料, 或許這還可以想想,
雖然這些數字在某方面而言是有歷史資料可以回溯的.

而我寫的那一篇 "寫部落格前五點的省思",
大部份是寫給曾做過 SEO 來看會更有感觸, 或者是
圖書館相關的人會感受更多, 對一般人適用度沒那麼高,
所以當作個參考就好.

[連結]

1. 熊瓶
http://blog.chonpin.idv.tw/

2. 好讀指數
http://geneoralspeaking.blogspot.com/2008/05/good.html

3. 寫部落格前的幾點省思 (反 SEO 的該看與不該看)
http://geneoralspeaking.blogspot.com/2008/05/seo_29.html

4. 對 SEO 的纏鬥投降
http://blog.ithome.com.tw/index.php?op=ViewArticle&articleId=17942&blogId=410

5. 暫停 technorati 列入排行
http://lookurs.blogspot.com/2008/05/technorati.html

[TAG]部落格, 部落格觀察, BlogLook, 排行榜, SEO

宅度計是一個很有趣的關鍵字分析, 包含對這個部落格文章內容屬性的分類分析外, 還可以算出這個部落格在那些議題有很好的表現, 以及這個部落格跟那些部落格有關聯...


先看這個部落格在宅度計達人的表現分析:

名次 名稱 第一次 最近一次 當選次數
1 web 2008-08-11 2008-08-24 4
2 Web 2.0 2008-06-04 2008-08-24 6
3 部落格觀察 2008-06-03 2008-08-24 9
4 部落格 2008-06-03 2008-08-17 7

這個表格代表這個部落格在上述四個議題有不錯的表現, 當然這個分析無法就文章的質量去分析, 所以事實上是去分析內容密度, 而這個部落格的確在這四項內容的密度是相當高的...

甚至從分類判別的觀點是:

網站軟體宅 55.8% 極度宅!!!!
旅遊地名宅 11.5% 普通宅!!
廠商產品宅 10.8% 普通宅!!
人名團體宅 10.2% 有點宅!
美食店家宅 6.7% 有點宅!
電視電影宅 3.5% 開始宅
時事話題宅 1.6%

追加 3C商品類 宅度: 15.0分 普通宅!! (關鍵字: 硬碟)
追加 政經社會 宅度: 15.5分 普通宅!! (關鍵字: 賺錢)
追加 網管程設(IT) 宅度: 64.6分 極度宅!!!! (關鍵字: load balancing)

在追加分類中是這三個分類的專精度較高, 這也是相當合理....
另外在所謂的關鍵字關聯分析算出來這個部落格相近議題的前 10 名有:

名次 名稱 關係度
1 掇拾 22.56
2 T-Times.NET 生活雜想 :: start 20.39
3 Blog E 20.37
4 艾德的部落格天空 19.60
5 Hi! I’m clsung 19.48
6 中時部落格-李偉文部落格 17.94
7 阿孝札記 17.53
8 Think of Joe - Yam 樂多日誌 17.44
9 @ONE爸爸的隨想手札 17.35
10 淡水生活 16.97


只是這個前十名是我經過篩選出前 10000 名以內的, 並不是真的表的前 10 名, 上面除了 Blog E 與 Think of Joe 與李偉文這三個部落格怪怪的之外, 其他七位的部落格都蠻值得參考的....

最近有一個人在 iT 幫幫忙問到有那些不錯的 IT 部落格, 就宅度計也有類似的排行, 我們來看看扣掉好讀低於 1 分的前 10 名有那些?

名次部落格宅度關鍵字好讀
1 Abin's Tech Note 39.3 度 javascript 3
2 SeekING Bernie 33.5 度 actionscript 2
3 小歪碎碎念 32.8 度 防毒軟體 2
4 YORKXIN×YORKXIN 26.4 度 Google App Engine 3
5 工程師級的顧問 / 【食 25.8 度 load balancing 3
6 Girvan 資訊邦 25.3 度 程式開發日 3
7 來看部觀門 25.2 度 關鍵字 3
8 愛德華日誌 24.6 度 Ruby on Rails 2
9 黑咪倫-北大武山下的� 22.8 度 程式 2
10 阿榮福利味 22.7 度 程式 5
16 plAymOrE.cOm 22.6 度 免費防毒軟體 2

當然這 10 個部落格並沒有被提及, 畢竟這個只是密度, 不是優質與否, 只是當作一種閱讀的參考也是相當有趣的....
[W2O]新台灣Web 2.0觀察表增加 Google Trends 的資料 這篇文章寫出來後, 就應該有些人知道這個小工具可以排出 google trends 的排行榜了, 而我的確寫成小工具, 放在 Google Trends Vistors Caculator 中.

當 然這排行榜看不到 google.com, google.com.tw 甚至是 youtube.com, 畢竟這個是 google 自己做的, 不會提供這數值, 而 yahoo 在台灣拆成 yahoo.com.tw, yahoo.com, 以及當然加上無名小站, 而 Microsoft 的 live.com, msn.com 與 microsoft.com 都是蠻前面的, 所以這時候可以看到母雞帶小雞的最佳範例...

而在這邊整理出幾項觀看事項:

1. Google 家族不存在這榜上..

2. Yahoo 與 Microsoft 家族在前 10 名就占了 6 名.

3. 討論區網站像 Alexa 第 15 名的伊莉掉到 35 名, 微風從 17 名掉到 37 名, 台灣論壇是 18 到 32 名...

4. 像 ziddu.com, dreamhosts.com, rapidshare.com, oursogo.com, 等一些下載的網站, 在 Alexa 也都較高, 但在這榜都是在外面了....

5. 一些新聞性與入口網站在這個以 visits 為主的排行也都比 Alexa 高, 如中時, 自由.

6. 在 Alexa 偏低的網站在這邊衝上去的是 tinyurl.com 與 engadget.com

7. 遊戲的討論網站如 gamebase, gamer 都較低, 但是 gamania 與 gamefiler 倒是上去了...

8. Yahoo 的第一名真的很可怕, 這個 293 萬, 可以說是到 23 名扣掉 Microsoft 的總人數, 且此時還沒加無名的 123 萬與 64 萬的 yahoo.com.tw...




最後, 在這邊列個表, 列出這 60 名, 以及在 Alexa 的排名讓大家自己研究看看吧..
更進一步的資料是在 http://myurl.tw/00dF
事實上有人說跟 Alexa 的 visit 說不定差不多, 但這也是真實的, 但在廣告效益中, 本來就應該是算被多少人看過, 而不是只是算被看多少次, 畢竟訊息傳答到就夠了, 再多次在某方面觀點是個浪費...

[後記] 這篇是寫於 6 月 29 日, 數字已經多少不一樣, 也多少有些變動, 但整體是差不多了多, 但這次還是貼出來, 畢竟這兩個月來也沒有人公布相關的議題與文章....

這個 13 點可以說是我做顧問/工程師快 10 年或超過 10 年下來的總整理, 但也是這 4年在思索的東西, 尤其是這 2 年, 我不只是以顧問的角色來看系統管理, 也以使用者與 "完全" 的開發者經驗來看這件事, 這是比較少人有這經驗, 甚至是也是因為有這些經驗, 我才會有如此多的感觸...

但這 13 點真的要解釋舉例完可能比一本書還厚, 我也很想寫出來, 只是我知道自己懶惰的個性這是不可能的, 我也知道寫出來沒解釋是很難抓到精隨, 絕對不是我不願意公開分享, 所以至少先寫出來給大家看的一個 Roadmap, ....

Level -1 外部意見層級
對像: 使用者的想法
內容: 透過抽樣, 檢測或調查得知對網站的評價

Level 0 搜尋引擎層級
對像: Yahoo 與 Google
內容: 網頁數, 排名, 關鍵字, 失效網頁, Sitemap

Level 1 使用者模擬層級
對像: 其他 IDC, ADSL 與光纖
內容: 回應時間, 網頁讀取模擬, 流程模擬

Level 2 網路層級
對像: 流量, 網路設備等
內容: 各 IDC 之間流量, 各伺服器與網路設備的流量, 網路設備的狀態

Level 3 伺服器層級
對像: 各個 Server的狀況
內容: 硬碟, CPU, 記憶體, IO, 中斷, 及作業系統層面的監控

Level 4 應用程式層級
對像: 每個程式的執行記錄
內容: 失敗記錄, 執行狀態記錄, 資源記錄的監控

Level 5 Log 層級
對像: 系統與系統程式的記錄分析
內容: 系統Log, Apache Log, 整合與警示監控

Level 6 資料庫層級
對像: 資料庫的運作狀況
內容: 資料庫的流量, Query (Slow Query數), 備份機制運作狀態

Level 7 網路安全層級
對像: 對 DOS/DDOS 之 IDS, IPS, AFE 等的監控
內容: 對網路設備與流量內容的記錄與監控, 並提出防禦

Level 8 使用者行為層級
對像: 對惡意使用者提出防範, 協助使用者完成交易
內容: 記錄與稽核使用者行為, 從最上層對惡意使用者防範

Level 9 業績層級
對像: 從交易結果做監控與稽核
內容: 各業種之交易記錄, 包含訂單狀況與利潤等業績物件之掌控

Level 10 預測層級
對像: 從歷史記錄找到每一層級之間配合的問題
內容: 預測行為找出特徵, 去確認所有的跡象都是符合安全監控

Level 11 管理階層
對像: 管理者如何面對網站的意見
內容: 這部份我還沒想到可以自動化的方式~~~~

[這是一篇 iTHome 的原生文章, 目前沒在其他地方發表]

雖然我都開玩笑的說, 唸圖書館的人會發現所謂的 SEO 的許多原則都是放在教科書, 但在唸到這些部份的時候, 都會灌輸一堆 "資訊檢索" (Information Retrieval) 的一些 "道德" (Ethic), 我有時會覺得這些道德是蠻無趣的, 因為真的會有人去做這些 "缺德" 的事, 讓資訊檢索的原則失效或者是偏差嗎? 任何圖書館員不會這麼無聊吧, 但若放在 SEO 的狀況, 或許因為所有的書都教你怎做會幫忙 SEO, 但卻沒有教任何有關的資訊檢索的原則, 所以到最後都是一堆讓人啼笑皆非的事發生~~~

這篇文章的動機是因為當我把部落格觀察有關 Technorati 的部份慢慢的修掉後, 覺得我真的沒必要去跟那些人玩遊戲的狀況下覺悟的, ...

在看這篇文章之前大家可以回頭看一下這幾篇文章...

1. 從連結炸彈到排行榜炸彈?
2. 部落格觀察
3. 為甚麼部落格觀察不只有一個排行, 但...

以及最新的 我一些 blog 排名的變化 這幾篇文章, 而在之前的確寫到 部落格觀察的下一步..., 當時就有意圖在綠眼觀注等不幫這些 SEOer 背書, 但或許現在想想也沒甚麼意義, 因為再怎樣都很難取捨, 因為真的有問題的部落格, 從 Bloglines 的排行榜就一眼得知, ...
排名Blog 名稱
1/1454(1454) 活力藥師網 :: PIXNET BLOG 2145
2/27(27) 三腳貓學狗叫 - Hi3B 2107
3/43(43) 半桶水網路觀 - Hi3B 2097
4/906(906) PUTKEY | 只是熱詞, 找著 2097
5/910(910) 活力藥師網 1710
6/642(642) 活力藥師網-新浪部落 1708
7/234(234) 活力藥師網 1700
8/50(50) 活力藥師網 1695
9/626(626) 玉里 1448
10/620(620) 網站優化與網路行銷 -Hi3B 1443
11/1611(1611) PHPTW 1442
12/153(153) PHPTW - Hi3B 1442
13/593(593) 璞石閣 1432
14/401(401) 花蓮網 1393
15/694(694) 白文咪咪與小鸚KIKI-天空部� 1144
16/1(1) 彎彎 875
17/3(3) Mr. 6 - 趨勢.創業.投資. 856
18/35(35) 阿修的部落格 855
19/321(321) Gea-Suan Lin’s BLOG 845
20/26(26) 苦牢之最後一年 809

第 一名訂閱的不是彎彎, 更不是 Blog Gadget 長青樹白文咪咪與小鸚KIKI, 更不是 Mr.6 或阿修, 當然也輪不到義氣幫的 GSLin 與 ijliao, 甚至連李怡志都被踢出榜外, 更不用說 carol 跟工頭了, 因為前 1 名到 14 名是由兩個人所占據的, 更不要說前 3 名了~~~

這狀況無獨有偶, 我們來看 Technorati 的排行榜:
排名Blog 名稱/
1/1494(1494) ╮(╯▽╰)/夢與天堂攴空想� 531/207
2/1(1) 彎彎 3081/9
3/216(216) 『Chris's Crime』 5744/10
4/906(906) PUTKEY | 只是熱詞, 找著 11091/2662
5/742(742) 祖國台灣 13183/21
6/401(401) 花蓮網 13495/27
7/18(18) 【方道 13578/11
8/593(593) 璞石閣 14042/30
9/43(43) 半桶水網路觀 - Hi3B 14325/16
10/70(70) Xuite日誌:焱的繪圖小站 14417/20

前 10 名中, 甚至有 5 個部落格是由一個人所做的, ..... 第一個表是 "Bloglines 的排行榜", 第二個是 "Technorati" 的...

雖 然我都被點名說, 我是最沒資格說話的人, 因為被義氣幫的人以及 SEO 二人組指証我在做的網站都有掛自己的連結, 甚至還提出一個 "灌水數" 來做證明, 當時我還真的把連結給拿掉, 但後來想了很久, 認為在做這種工作人員的宣告並不違反我的理念下, 後來我還是掛上去了, ....

即 使我有一陣子不寫 "捷運日記", 但還是把連結放在同一個部落格, 畢竟這個工作人員宣告做到就好, 沒必要去影響其他部落格, 所以例如這個部落格的名次至少還是真實的, 但這個 "藉口" 好像無法被認同, 所以我在只好在這次的紛爭中宣告 "投降", 畢竟我已經沒甚麼力氣再說明甚麼了...

當然也是因為我最近發現 "只是捷運日記" 的名次已經跌到 86 名, 雖然這個可能只是搜尋引擎的跳動, 但至少離開前 30 名讓我感覺壓力沒這麼大了, 至少應該比較不會被認為在沽名釣譽了, 畢竟我也不認為我的部落格有這樣的資格, 所以在這麼多的因素交錯下, 現在也是個好時機吧~~~

[前言]我 常說, SEO 與 anti-SEO 之間得差別, 就是在於有沒有重視內容, 或者是否真的是為了 "人讀" 去寫的, 還是只是為了 Search Engine 來設計的 "機讀" 網站, 以及之間的比重~~~~ 當然之前的舉例剛好是最好的例證, 但最近也看到一堆賣房子的, 就是介於之間了...

事實上我都會私底下講, 部落格觀察用得是在圖書館學中的三種觀點的 "Content", "Meta" 與 "Usage" 的 Usage, 只是這使用比較是篇機器的, 也就是搜尋引擎, 除了 "重視度" 以外, 但到最後變成是一個 "類 SEO" 檢核工具, 雖然說我是在做之前就知道, 但也是盡量保持低調的不去說~~~

而宅度計最有趣的是, 可以知道這個部落的屬性, 這也是當時在做這系統的目標之一, 但最近因為時間慢慢的推移, 不少人使用後發現所謂的前 30 名的部落格, 除了是系統因素外, 似乎都是做 SEO 或刻意去玩關鍵字的...

我 常說, SEO 與 anti-SEO 之間得差別, 就是在於有沒有重視內容, 或者是否真的是為了 "人讀" 去寫的, 還是只是為了 Search Engine 來設計的 "機讀" 網站, 以及之間的比重~~~~ 當然之前的舉例剛好是最好的例證, 但最近也看到一堆賣房子的, 就是介於之間了...

所子在宅度計的計算中, 也梢微修改了一下, 讓這種狀況減緩些, 但也是在不影響計算下做些像 "Normalization" 的事, 雖然這個 "正規化" 的工作可能還要再一陣慢慢才會真的有最後的結果, 但這也是 Data Mining 資料探勘最有趣的地方, 理論是理論, 實務是實務, 如何做出一個真的可以用的系統也不是那麼簡單~~~~


當然為了 SEO 或這個宅度去改變自己寫作的內容才是最無聊的, 畢竟表現出更多的自己且沒有太多偏差是不容易, 若還要去想東想西的話就真的不是好事, 當然這些話是在 SEO 的人中是句無聊的話, 尤其在我的口中說除來更沒有說服力, 呵呵~~~

目前這個部落格的宅度計狀況:

網站軟體宅 53.5% 極度宅!!!!
人名團體宅 14.8% 普通宅!!
旅遊地名宅 9.7% 普通宅!!
美食店家宅 7.8% 有點宅!
廠商產品宅 7.4% 有點宅!
電視電影宅 5.1% 有點宅!
時事話題宅 1.7%

這部落格最宅關鍵字: 部落格

絕對宅度:156%

追加 AV女男優 宅度: 6.2分 有點宅! (關鍵字: 長瀨茜)
追加 3C商品類 宅度: 22.8分 相當宅!!! (關鍵字: 手機)
追加 攝影類別 宅度: 6.3分 有點宅! (關鍵字: 大頭貼)
追加 音樂類 宅度: 29.9分 相當宅!!! (關鍵字: 星光幫)
追加 電影類 宅度: 18.8分 普通宅!! (關鍵字: 蜘蛛人)
追加 政經社會 宅度: 11.5分 普通宅!! (關鍵字: 賺錢)
追加 閱讀文學 宅度: 13.3分 普通宅!! (關鍵字: 博客來)
追加 汽機車 宅度: 6.0分 有點宅! (關鍵字: autoblog)

[連結]

1. 這個部落格的宅度
http://otaku.datamining.tw/otaku.php?BlogID=3

2. 甚麼是宅
http://blog.roodo.com/genehong/archives/5877577.html

3. 這篇文章原文是在 "來看關鍵字"
http://lookdoor.blogspot.com/2008/05/seo.html

這篇比較多技術性的東西, 不想看的人可略過~~~

這個計劃最早是在去年 8 月部觀門做的時候, 就在想這就是一個有趣的 Semantic Web (語意網路), 所以有甚麼可以加值利用, 而在一次跟 jeph 的討論時, 我就想到這個可能性, 那時應該是 10 月左右吧, 只是當時歪頭想了一下, 這是一個很吃資源的計算, 所以在沒想到合理的演算法之前, 是不敢動工的~~~~

後來在做 w2o.tw 的計劃後, 就用到在 door 時就有用到的產出一個 include file, 事實上是一個寫好存起來的 array, 雖然這個發現當量大時, 也會極度吃資源, 所以也曾跟 wildcat 討論到這現像, 所以有時不該存成 array, 而是字串之類的, 然後再去 explode 吧...

只是此時就已經想到可以比較不吃資源的方法, 然後就是實作了, 但在陳冠希事件時, 我為了解決部觀門的 Loading, 真的是耗盡心力, 更何況還有其他的案子在 Run, 而在最近, 慢慢想開一件事後, 或許整個腳步要做調整之前, 想要完成的就是這個 "宅度計" 了~~~~

因為部觀門的關鍵字, 是以熱門為主軸, 而在熱門導向的趨勢下, 漸漸的產生所謂的八個大分類, 雖然當時寫分類時, 也是寫成 Relation 的架構, 所以也是 Network (網路) 的關係, 並沒有所謂大分類的必要性, 但分類的本質就是要產生關係, 有較薄弱的大關係與較強的小關係族群都是很重要的, 只是在負荷與操作介面 (UI) 還沒解決之前只有這八分類了.

當然, 這些數字都是 RSS 讀來之後去作分析, 也是基本的計數, 但說真的要做好一般化 (Normalization) 到更有意義也不是簡單的事:

1. 符合數量越多時, 自然是更高, 但不能成線性正比
2. 當一個關鍵字的字串長度越長時, 越難相符, 自然更顯著些
3. 一個關鍵字在所有的部落格量的比重也是要參考 (目前尚未寫入)
4. RSS 的篇數與長度也會影響計算的量 (目前尚未寫入)

最 後這八分類有各自的分數後, 來看比例就是最後的百分比, 但百分比只是自我在做比較, 若是要做絕對量度的話, 還是要計算分數, 而最後也是用等比級數去做分級, 然後變成 "極度", "相當", "普通", "有點", "開始" 這五種, 以及沒有的第六種~~~

而 最後列出這個部落格的代表字, 是以這個分類中分數最高的來顯示, 所以不見得是次數最多的一個關鍵字, 甚至有人以為這個系統有參考到 "搜尋" 的關鍵字, 事實上是沒有的, 因為這次是純作內容分析, 而關鍵字分析的成份分析, 的確在部關門的第二代改版中會包含在內...

只是, 到底甚麼是 "宅"? 我想這應該有機會可以好好討論, 畢竟這次用的網址刻意選用 Data Mining (資料探勘), 是有相當的原因的, 這個也可以之後再討論.

但現在我從搜詢引擎已經看到不少網友寫了介紹, 說真的他們寫的都比我好, 所以我這邊不會寫介紹與操作, 畢竟這是我的外行...

感謝下面幾篇:

【Blog】超準確真實部落格宅度計
永遠的真田幸村: 超準確真實部落格宅度計
[BLOG] 你的部落格宅不宅!?
宅度計】測試你的「部落格」宅不宅? 怎樣宅?
Wangtam: 部落格觀察推出“宅度計
部落『宅』度大調查!
看看自己的部落格夠不夠宅--宅度計
超準確部落格資料探勘宅度計

甚至有人已經寫了 Gadget 出來了:

非官方宅度計貼紙

Anyway, Take it serious and take it easy~~~~
[前言]有人說他打死不賣網路廣告, 因為網路廣告的
成效是很簡單評估的, 所以價格很容易訂出來,
因此說要有溢價的可能性而有更高的獲利空間
是很難, 這對一個超級業務員是很糟糕的事,
因為很多利潤都是來自於資訊的不對稱所造成.

當然說要了解部落格的價值, 有時沒那麼簡單,
上次說除了那個誇大的 "How much is your blog
worth" 外, 還有沒有較為實際一點的工具呢?

在 "黑貘來說" 目前寫了兩篇有關 "從 Google
Analytics" 看部落格/網站經營, 但預計要寫至少五
篇才足夠的把這部份寫完, 這未嘗不是一個辦法,
因為從 GA(Google Analytics) 是最簡單知道一個網
站狀況的工具, 但前題也是要了解這要怎麼用才行.

況且, GA 有一個最大的功能就是可以把報告分享
出去給別人看, 包含廣告主之類的, 這可能是最好且
誠實的作法, 只是這會不會洩露太多資訊, 而造成估
價無法更高.

當然, 有人說他打死不賣網路廣告, 因為網路廣
告的成效是很簡單評估的, 所以價格很容易訂出來,
因此說要有溢價的可能性而有更高的獲利空間是很難,
這對一個超級業務員是很糟糕的事, 因為很多利潤都
是來自於資訊的不對稱所造成.

但這理論上聽起來也不見得是壞事, 因為這代表
一個踏實的業務不用花太多的精力, 就可以很精確的
去掌控價格才對, 只是這是理論, 因為網路廣告的客
戶最大的問題是不見得真的了解如何去看一堆網站的
報告, 甚至是說讀通 GA 也不是那麼簡單的情型下,
到最後這價格又變成一場混戰了.

在 "Webmaster 系列" 說到要成為一個好的網
站管理/經營人真的很不簡單, 因為必須有很多的
Know-How 去了解, 甚至我都還主張所謂的 "網主託管"
不是指把網站放在別人的機器上, 而是請人來幫忙去
擔任第一線的 "Webmaster", 去操作這些技術與數字,
然後幫忙作決策.

一直認為理論上你真的要經營網站, 也就是說
網路上的收益是最大的來源的時候, 無論像是 GA,
Google/Yahoo Webmaster Tool (網主工具), 甚至很
多 3rd Party 付費與免費的工具都要去善用, 就像
是我真的懷疑沒去看像 "創市際 ARO 報告" 的網路
公司如何去制定策略, 當然這句話有很明顯的 "置入
性廣告", 但確又很真實的.

這都是比較完美但很難去實作, 所以到最後我都
做一個最簡單的評估方式:

"這個網站/部落格目前看 Google Adsense 賺多
少錢, 而可以依對像的準確度與內容交集度加碼三倍
到九倍, 而即使沒有直接關連, 至少可以拿 Adsense
的錢做為基準".

當然這句話是說給想要去做網站或部落格行銷的
業者聽的, 因為如同第一篇所說的, 有很多行銷人員
完全錯估一個網站或部落格的價值, 不是高估就是低
估, 只是這邊有個前提是 "如何証明 Adsense 的收益"?

這幾天 Adsense 在做帳號合併的動作, 說不定就
會有可以開放給其他人看報告的權利, 但目前最簡單
且不會有權責問題的就是用 Adsense 既有的 email
報告系統來寄給買主, 以茲證明...

所以若是一個部落格, 一個月可以從 Adsense
的廣告獲得 100 美金, 至少有媒體價值每個月 3000
台幣的水準, 但若是對像符合的話, 事實上 9000 到
27000 都是合理的狀況, 只是對像符合這個就是
case by case 了.

這樣說還是很模糊, 留待下篇舉例好了.

[連結]

1. 部落格的價值(I):你的部落格值多少?
http://blog.roodo.com/genehong/archives/5433639.html

2. 資訊架構師 (II) WebMaster?
http://blog.yam.com/genehong/article/11644225

3. 部落格經營來源的分佈 (從數字來看網站經營系列 I)
http://geneoralspeaking.blogspot.com/2007/09/1k2k-7-81-12-5001000-3-68-29-2k5k-26-33.html

[TAG]Adsense, Analytics, 廣告, Webmaster, Blog,

[前言]"部落格的價值或部落格行銷即使有不同的衡量
方式, 但也必須認清這是一個媒體, 還是可以
用傳統方式來評估與計算".

有不少人來找我, 都是問有關部落格的問題, 說
真的, 我最近也越來越少寫相關的文章, 但與其說少
寫部落格的文章, 但更應該是說我最近很少寫部落格
吧? 但事實上倒不是說沒在寫部落格, 而是都是在寫
"官方部落格", 或 "官方個人部落格" 的文章了, 這
些都是有特定的方向的.

在很早以前就有一個貼紙, 上面大喇喇的用美金
的圖片, 標題就是 "How much is your blog worth",
當然這個 Widget 有很多人都有放, 但我是沒放過,
但這貼紙是很早期的方式, 所以都是必須自己去更新
的, 自然我沒甚麼興趣.

甚至是說, 我雖然認為部落格本質是一個在推銷
與呈現的系統, 無論推銷的是想法或理念, 或者只是
呈現自己的生活, 所以在兩年前就說, 部落格沒必要
去劃清自己是否是 "置入性行銷", 但要真的用真誠
且自發的心去寫作, 而不應該去探討部落格是否能夠
賺錢.

但這兩年來, 有太多人來找我討論部落格行銷的
相關議題了, 而比較令我好笑的是, 大部份的人都太
過於高估部落格的價值了, 只是比較嚴重的是連價值
的方向與主要的本質都有所偏差, 往往害我不知道如
何講下去, 最後只好以 "嗯~~" 來收場, 畢竟我不是
那種會跟人爭辨的人, 更不是傳教個性的人.

基本上我在之前有說過一句話:

"Web 2.0 或許該用不同偉大的觀點去衡量, 但還是可
以套用既有網站的衡量方式, 只是必須有所加乘與加值".

在部落格中, 我也可以這樣說:

"部落格的價值或部落格行銷即使有不同的衡量方式,
但也必須認清這是一個媒體, 還是可以用傳統方式來
評估與計算".

當然我不是要說部落格同等於一般的網站或媒體,
甚至部落格是一個跟傳統媒體有很大差別的型式與操
作方式, 所以用一般傳統媒體去操作部落格是很糟糕
的事, 但相對的把部落格自我膨漲到超過媒體的水準
也是相當的危險.

而我最常見到的, 因為常常看到我散落到各處被
引用的文章, 去假設我的部落格有很高的點閱數,
而去想像點閱數與價值劃上等號, 這很明鮮的犯了一
個很大的錯誤, 但相對的不去管點閱數而去吹捧所謂
的影響力, 更也是個大錯誤.

因此我曾經建議部落格廣告必須參考這兩項指標,
一個就是傳統的點閱數, 一個是部落格自己本身的計
算方式, 後來我用部落格觀察的指數當作擴散力,
目的就是要平衡這兩個不同觀點的落差.

這也就是說, 在不同的情型下, 有時要著重點閱數,
有時要著重擴散力(影響力), 沒必要把這兩個劃上等號,
如同前面説的用點閱數是無法衡量文章的引用與散播力,
甚至是要把這兩個當作是兩個自由度很高的變因,
假設這是兩回事有時也不過份.

當然這其中是為甚麼呢? 或者是該如何做衡量呢?
我是打算分開再寫兩篇的, 但在寫之前, 可以參考我
之前寫過的一篇文章, "部落格楚門世界"

[連結]

1. How much is your blog worth
http://www.business-opportunities.biz/projects/how-much-is-your-blog-worth/

2. 部落格的楚門世界
http://geneoralspeaking.blogspot.com/2007/04/blog-post.html

3. 部落格廣告(下)
http://blog.yam.com/genehong/article/7559485

昨天(12/11)寫了一篇用 google-analytics 來看一些部落格經營的方向, 而 LVChen 提到會造成這些數字的各種因素, 也說的相當不錯, 也說到一句話: "所謂的從數字來看讀者使用方式,可能得分門別類的去解讀,一言蔽之很容易以偏概全吧。", 這句話相當不錯, 的確說到我懶惰的地方, 因為可能再下去要做更多的因子分析才對, 不該如此草率~~~

但我也常說一句 "Nothing Comes From Nothing" 以及 "事出必有因", 任何事情/數字都有其背後的意義, 所以若是看表相就說這就是事實是相當不對的, 甚至到最後, 也慢慢清楚任何數字都代表一個觀點, 也只能代表部份觀點, 更難以偏蓋全...

當 部落格觀察這個網站出來後, 許多人給予支持, 但伴隨著是更多的批評, 甚至在 "Blogblind" 也有人直接說我沒念過 "研究方法", 更沒修過 "統計學" 等等的話, 當然有些人話說到很難聽, 而我也一直在思考, 我用的方法跟書上寫的 "多變量分析" 到底有甚麼不一樣, 而請教不少數學/統計教授, 他們提出一個有趣的觀點: "數字是死的, 唯有在能夠解釋甚麼出來的時候是活的", 最後還是一個 "結果決定論", ...

就像說, 我們無法了解 "銀棒指數" 為甚麼是那樣加的 (計算公式 = 打擊率 * 1000 + 全壘打 * 20 + 打點 * 5 + 壘打數), 把一些不相干的數字加起來, 還加上一些更難去產生出來的權重, 但只要獎給的出去, 能夠有 "鑑別度", 就很夠了, 就像是我常說的, 為甚麼選美是泳裝, 台風, 問答, 才藝等一些分數再加權重算出來的? 這是永遠沒有學理的可能性...

但, 若是要把數字當作是一個多權威的東西又是一個更誇張的事...

就像是我把 w2o 推出去後, 立刻在 funp 就被 tempo 質問: "可是看起來一整個不準呀, 這次統計的權重又是如何呢?", 而我立刻暈倒, 因為在那個網站, 並沒有用任何的新數字, 用的是既有的 Alexa, 及 seednet 做的 Taiwanrank 及既有的 Bloglook 的指數, 那個系統只是一個整合介面, 把這些數字用各個角度去看, 而能夠更方便操作的系統, 所以我也只能回答:
這次是沒有新東西, 只是子集合, BlogLook 是既有的指數..
然後獨立一個是抓 alexa 台灣部份, 一個是抓 seednet 的 Taiwan Rank...
套句我的說法, 在這世界上沒有一種算法是能夠涵蓋全部觀點的...
只能用較多的觀點去 approach 所謂的 "真實"....
所以當我昨天回答完 LVChen 的話時, 立刻做了一個夢, 夢到人應該是把數字作為參考的, 結果變成不是過於信任數字, 不然就是過於不信任數字的狀況, 因此在這種情型下, 我覺得應該要道歉與澄清:
對於那些過於信任數字的人道歉, 畢竟數字只是表相, 無法取代真實, ...
對於那些過於不信任數字的人澄清, 所有數字都有其意義, 不能否認其算出來所代表的面相..
就 像是昨天 Taiwanrank 的主導者(?)問我, 對 Alexa 相信多少, 我都回答所有名次也都有 10%~30% 的誤差, 因此, 且越後面越大, 所以就台灣的排行榜而言, 大概只有 2000 名才稍具參考價值, 但到 500 名內準確度就有一定水準, 而全球的部份也是從 10 萬才有意義, 到 2 萬名再來看關係就夠了....

即使像 TaiwanRank 在一定的子集合, 理論上是完全沒有誤差, 但是否能夠代表母集合, 甚至能夠代表所有的行為, 這都是必須經過一個 mapping (映射) 才有意義, 不能直接拿來用, 不然更是以偏蓋全, 而我在之前的文章就說過其特性了, 因此更要去從了解特性去閱讀, 這也可以套用閱讀所有數字的前題..

而昨晚把 w2o 加了一些不同數字與圖型的承現, 也希望這樣可以有更多不同的方式來解讀, 所以 "否定數字背後有可能存在原因是不對的, 更不能用一個數字來去代表所有的真實"..

因此, 在觀看與使用 "部落格觀察" 系列的數字, 以及閱讀我去搜集數字來去做一些推論, 請接受我的道歉與澄清...
1 2 3 4 5 6 7  下一篇»