使用搜尋引擎時,希望能過濾自己單位內某些敏感或機密資料,不要讓他出現。
請依照下列方式,解決這個問題。
首先請您先確定,這些資料是誰提供的?因為這些不同,會有不同的處理方式。
(a)您是這個網站的管理人,這些是您自己單位網站的資料。
(b)您自己單位撰寫並上傳的網頁。
(c)非您所屬的網站或不是您自製的網頁,由其他網站或人士製作的網頁。
(a)您是網站管理人
步驟一:
請您先將資料檔案(或目錄)移除網路伺服器可以存取的範圍或刪除。或是在網路伺服器上,將該檔案(或目錄)的讀取權限設為保護或需密碼才能讀取。
步驟二:
依照SRE(Standard for Robot Exclusion)標準,在您的網路伺服器上,增加一個robots.txt。例如蕃薯藤網站的位置在http: //www.yam.com/robots.txt。您如果在這個檔案中進行設定,一般來說都可以阻止有道德的搜尋引擎程式讀取並儲存您的網頁。
步驟三:
依照上述兩個方法,約一個月後,網路使用者便不能經由搜尋引擎搜尋您的網頁。如果您想馬上移除搜尋引擎中已經有的資料。請您在這網站裡設一頁給Google搜尋引擎;例如您要求移除的是
www.xyz.edu/aaa 這頁,請您在這頁下加入
www.xyz.edu/aaa/forgoogle.html,頁裡重申要移除的網址,這樣Google才能確定您真的是網主。並且請英文來信至
[email protected],列出您希望移除的網頁,如此即可馬上移除。
(b)您不是網站管理人,但這是您撰寫的網頁。
步驟一:
同樣請您先將資料檔案(或目錄)移除網路伺服器可以存取的範圍或刪除。
步驟二:
您可以在網頁的HEAD區段中,加入一些特殊的HTML META TAG標籤,來指出某一個網頁是否可以被索引、分析或鏈接。例如你可以加入。
<META NAME="ROBOTS" CONTENT="NOINDEX">
表示:不希望搜尋引擎處理、儲存這個網頁。
<META NAME="ROBOTS" CONTENT="NOARCHIVE">
表示:希望搜尋引擎處理這個網頁,但是不儲存網頁,也就是說,不會有庫存頁。
<META NAME="ROBOTS" CONTENT="NOFOLLOW">
表示:希望搜尋引擎處理這個網頁,但是不繼續處理這個網頁中另外連結的網頁。
<META NAME="ROBOTS" CONTENT="NOINDEX,NOFOLLOW">
表示:不希望搜尋引擎處理、儲存這個網頁,以及這個網頁中另外連結的所有資訊。
步驟三:
依照上述兩個方法,約一個月後,網路使用者便不能經由搜尋引擎搜尋您的網頁。如果您想馬上移除搜尋引擎中已經有的資料。請您在這網站裡設一頁給Google搜尋引擎;例如您要求移除的是
www.xyz.edu/aaa 這頁,請您在這頁下加入
www.xyz.edu/aaa/forgoogle.html,頁裡重申要移除的網址,這樣Google才能確定您真的是網主。並且請英文來信至
[email protected],列出您希望移除的網頁,如此即可馬上移除。
(c)非您所屬的網站或不是您自製的網頁,由其他網站或人士製作的網頁。
建議您,先與該網站或是與製作該網頁的管理人聯絡,請他依照前述辦法進行處理。
若您認為該網站已涉及妨害秘密、誹謗或其他罪嫌,您可向刑事警察局或各縣市警察機關報案,NET110網站也提供您直接線上檢舉網路犯罪。
以上資料來源為:
http://www.yam.com/help/doc_google.html
或尋找
http://www.google.com.tw/support ... topic.py?topic=8459