發新話題
列印

希望搜尋能過濾某些敏感資料不要讓他出現

希望搜尋能過濾某些敏感資料不要讓他出現

使用搜尋引擎時,希望能過濾自己單位內某些敏感或機密資料,不要讓他出現。

請依照下列方式,解決這個問題。
首先請您先確定,這些資料是誰提供的?因為這些不同,會有不同的處理方式。

(a)您是這個網站的管理人,這些是您自己單位網站的資料。
(b)您自己單位撰寫並上傳的網頁。
(c)非您所屬的網站或不是您自製的網頁,由其他網站或人士製作的網頁。
          (a)您是網站管理人
           步驟一:
請您先將資料檔案(或目錄)移除網路伺服器可以存取的範圍或刪除。或是在網路伺服器上,將該檔案(或目錄)的讀取權限設為保護或需密碼才能讀取。

步驟二:
依照SRE(Standard for Robot Exclusion)標準,在您的網路伺服器上,增加一個robots.txt。例如蕃薯藤網站的位置在http: //www.yam.com/robots.txt。您如果在這個檔案中進行設定,一般來說都可以阻止有道德的搜尋引擎程式讀取並儲存您的網頁。

步驟三:
依照上述兩個方法,約一個月後,網路使用者便不能經由搜尋引擎搜尋您的網頁。如果您想馬上移除搜尋引擎中已經有的資料。請您在這網站裡設一頁給Google搜尋引擎;例如您要求移除的是www.xyz.edu/aaa 這頁,請您在這頁下加入 www.xyz.edu/aaa/forgoogle.html,頁裡重申要移除的網址,這樣Google才能確定您真的是網主。並且請英文來信至[email protected],列出您希望移除的網頁,如此即可馬上移除。
          (b)您不是網站管理人,但這是您撰寫的網頁。
           步驟一:
同樣請您先將資料檔案(或目錄)移除網路伺服器可以存取的範圍或刪除。

步驟二:
您可以在網頁的HEAD區段中,加入一些特殊的HTML META TAG標籤,來指出某一個網頁是否可以被索引、分析或鏈接。例如你可以加入。

<META NAME="ROBOTS" CONTENT="NOINDEX">
表示:不希望搜尋引擎處理、儲存這個網頁。

<META NAME="ROBOTS" CONTENT="NOARCHIVE">
表示:希望搜尋引擎處理這個網頁,但是不儲存網頁,也就是說,不會有庫存頁。

<META NAME="ROBOTS" CONTENT="NOFOLLOW">
表示:希望搜尋引擎處理這個網頁,但是不繼續處理這個網頁中另外連結的網頁。

<META NAME="ROBOTS" CONTENT="NOINDEX,NOFOLLOW">
表示:不希望搜尋引擎處理、儲存這個網頁,以及這個網頁中另外連結的所有資訊。

步驟三:
依照上述兩個方法,約一個月後,網路使用者便不能經由搜尋引擎搜尋您的網頁。如果您想馬上移除搜尋引擎中已經有的資料。請您在這網站裡設一頁給Google搜尋引擎;例如您要求移除的是
www.xyz.edu/aaa 這頁,請您在這頁下加入 www.xyz.edu/aaa/forgoogle.html,頁裡重申要移除的網址,這樣Google才能確定您真的是網主。並且請英文來信至 [email protected],列出您希望移除的網頁,如此即可馬上移除。
          (c)非您所屬的網站或不是您自製的網頁,由其他網站或人士製作的網頁。
           建議您,先與該網站或是與製作該網頁的管理人聯絡,請他依照前述辦法進行處理。

若您認為該網站已涉及妨害秘密、誹謗或其他罪嫌,您可向刑事警察局或各縣市警察機關報案,NET110網站也提供您直接線上檢舉網路犯罪。
 
 

以上資料來源為: http://www.yam.com/help/doc_google.html

或尋找http://www.google.com.tw/support ... topic.py?topic=8459

TOP

(點上方按鈕開啟)億商互動售前諮詢MSN帳號為: [email protected] ,歡迎您詢問主機、金流、物流、維護服務上的問題
發新話題