国产av日韩一区二区三区精品,成人性爱视频在线观看,国产,欧美,日韩,一区,www.成色av久久成人,2222eeee成人天堂

Rumah Topik SEO 什么是robots.txt?

什么是robots.txt?

May 23, 2019 am 11:01 AM

robots.txt是搜索引擎訪問網(wǎng)站時(shí)要查看的第一個文件,是用于規(guī)定搜索引擎對網(wǎng)站內(nèi)容抓取范圍的文本文件。當(dāng)一個搜索蜘蛛訪問一個站點(diǎn)時(shí),它會首先檢查該站點(diǎn)根目錄下是否存在robots.txt,如果存在,則會按照文件中的內(nèi)容來確定訪問的范圍。

什么是robots.txt?

在網(wǎng)站建設(shè)過程中我們會有一部分內(nèi)容不希望被搜索引擎抓取到或者不希望其在互聯(lián)網(wǎng)中出現(xiàn),那么要怎么辦呢?我要怎么跟搜索引擎說你不要抓取我的xx內(nèi)容呢?這時(shí)候robots就派上用場了。

robots.txt是搜索引擎中訪問網(wǎng)站的時(shí)候要查看的第一個文件。Robots.txt文件告訴蜘蛛程序在服務(wù)器上什么文件是可以被查看的。

當(dāng)一個搜索蜘蛛訪問一個站點(diǎn)時(shí),它會首先檢查該站點(diǎn)根目錄下是否存在robots.txt,如果存在,搜索機(jī)器人就會按照該文件中的內(nèi)容來確定訪問的范圍;如果該文件不存在,所有的搜索蜘蛛將能夠訪問網(wǎng)站上所有沒有被口令保護(hù)的頁面。

語法:最簡單的 robots.txt 文件使用兩條規(guī)則:

? User-Agent: 適用下列規(guī)則的漫游器

? Disallow: 要攔截的網(wǎng)頁

但是我們需要注意的幾點(diǎn):

1.robots.txt必須存放在網(wǎng)站的根目錄下,

2.其命名必須為robots.txt,且文件名必須全部小寫。

3.Robots.txt是搜索引擎訪問網(wǎng)站的第一個頁面

4.Robots.txt中必須指明user-agent

robots.txt使用誤區(qū)

?誤區(qū)一:我的網(wǎng)站上的所有文件都需要蜘蛛抓取,那我就沒必要在添加robots.txt文件了。反正如果該文件不存在,所有的搜索蜘蛛將默認(rèn)能夠訪問網(wǎng)站上所有沒有被口令保護(hù)的頁面。

?每當(dāng)用戶試圖訪問某個不存在的URL時(shí),服務(wù)器都會在日志中記錄404錯誤(無法找到文件)。每當(dāng)搜索蜘蛛來尋找并不存在的robots.txt文件時(shí),服務(wù)器也將在日志中記錄一條404錯誤,所以你應(yīng)該做網(wǎng)站中添加一個robots.txt。

?誤區(qū)二:在robots.txt文件中設(shè)置所有的文件都可以被搜索蜘蛛抓取,這樣可以增加網(wǎng)站的收錄率。

?網(wǎng)站中的程序腳本、樣式表等文件即使被蜘蛛收錄,也不會增加網(wǎng)站的收錄率,還只會浪費(fèi)服務(wù)器資源。因此必須在robots.txt文件里設(shè)置不要讓搜索蜘蛛索引這些文件。

?具體哪些文件需要排除, 在robots.txt使用技巧一文中有詳細(xì)介紹。

?誤區(qū)三:搜索蜘蛛抓取網(wǎng)頁太浪費(fèi)服務(wù)器資源,在robots.txt文件設(shè)置所有的搜索蜘蛛都不能抓取全部的網(wǎng)頁。

?如果這樣的話,會導(dǎo)致整個網(wǎng)站不能被搜索引擎收錄。

robots.txt使用技巧

?1. 每當(dāng)用戶試圖訪問某個不存在的URL時(shí),服務(wù)器都會在日志中記錄404錯誤(無法找到文件)。每當(dāng)搜索蜘蛛來尋找并不存在的robots.txt文件時(shí),服務(wù)器也將在日志中記錄一條404錯誤,所以你應(yīng)該在網(wǎng)站中添加一個robots.txt。

?2. 網(wǎng)站管理員必須使蜘蛛程序遠(yuǎn)離某些服務(wù)器上的目錄——保證服務(wù)器性能。比如:大多數(shù)網(wǎng)站服務(wù)器都有程序儲存在“cgi-bin”目錄下,因此在robots.txt文件中加入“Disallow: /cgi-bin”是個好主意,這樣能夠避免將所有程序文件被蜘蛛索引,可以節(jié)省服務(wù)器資源。一般網(wǎng)站中不需要蜘蛛抓取的文件有:后臺管理文件、程序腳本、附件、數(shù)據(jù)庫文件、編碼文件、樣式表文件、模板文件、導(dǎo)航圖片和背景圖片等等。

?下面是VeryCMS里的robots.txt文件:

?User-agent: *

?Disallow: /admin/ 后臺管理文件

?Disallow: /require/ 程序文件

?Disallow: /attachment/ 附件

?Disallow: /images/ 圖片

?Disallow: /data/ 數(shù)據(jù)庫文件

?Disallow: /template/ 模板文件

?Disallow: /css/ 樣式表文件

?Disallow: /lang/ 編碼文件

?Disallow: /script/ 腳本文件

?3. 如果你的網(wǎng)站是動態(tài)網(wǎng)頁,并且你為這些動態(tài)網(wǎng)頁創(chuàng)建了靜態(tài)副本,以供搜索蜘蛛更容易抓取。那么你需要在robots.txt文件里設(shè)置避免動態(tài)網(wǎng)頁被蜘蛛索引,以保證這些網(wǎng)頁不會被視為含重復(fù)內(nèi)容。

?4. robots.txt文件里還可以直接包括在sitemap文件的鏈接。就像這樣:

?Sitemap: http://www.***.com/sitemap.xml

?目前對此表示支持的搜索引擎公司有Google, Yahoo, Ask and MSN。而中文搜索引擎公司,顯然不在這個圈子內(nèi)。這樣做的好處就是,站長不用到每個搜索引擎的站長工具或者相似的站長部分,去提交自己的sitemap文件,搜索引擎的蜘蛛自己就會抓取robots.txt文件,讀取其中的sitemap路徑,接著抓取其中相鏈接的網(wǎng)頁。

?5. 合理使用robots.txt文件還能避免訪問時(shí)出錯。比如,不能讓搜索者直接進(jìn)入購物車頁面。因?yàn)闆]有理由使購物車被收錄,所以你可以在robots.txt文件里設(shè)置來阻止搜索者直接進(jìn)入購物車頁面

Atas ialah kandungan terperinci 什么是robots.txt?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undress AI Tool

Undress AI Tool

Gambar buka pakaian secara percuma

Undresser.AI Undress

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Clothoff.io

Clothoff.io

Penyingkiran pakaian AI

Video Face Swap

Video Face Swap

Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Alat panas

Notepad++7.3.1

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Cara Melindungi Waktu Kerja Dalam dan Mengekalkan Fokus Sebagai SEO Cara Melindungi Waktu Kerja Dalam dan Mengekalkan Fokus Sebagai SEO Jun 19, 2025 am 10:07 AM

Bagi mana-mana profesional SEO, tetap fokus dan produktif boleh menjadi satu cabaran. Dengan kemas kini algoritma yang berterusan, mengubah trend dan penyebaran e-mel dan pemberitahuan, ia boleh merasakan anda sentiasa bermain menangkap.

Gambaran keseluruhan, klik dan kesan lalu lintas Google AI: Membongkar misteri Gambaran keseluruhan, klik dan kesan lalu lintas Google AI: Membongkar misteri Jun 22, 2025 am 09:42 AM

Google bermula termasuk gambaran keseluruhan AI (AIO) dalam hasil carian A.S. pada 14 Mei. Walaupun Google telah membuat rujukan samar-samar kepada fakta bahawa pautan dalam AIO mungkin mengalami kadar klik yang lebih tinggi (CTR), ia tetap tidak jelas apabila dipersoalkan secara langsung

WordPress 6.5 Keuntungan LastMod Tarikh untuk Fail Sitemaps WordPress 6.5 Keuntungan LastMod Tarikh untuk Fail Sitemaps Jun 23, 2025 am 09:42 AM

WordPress Versi 6.5 kini termasuk sokongan untuk fail lastmod in sitemap, yang boleh membantu enjin carian mengenal pasti kandungan baru atau dikemas kini. Peningkatan ini boleh meningkatkan kecekapan merangkak dan mengurangkan beban pelayan.lastmod. Elemen lastmod boleh

Memikirkan semula Strategi Kata Kunci Anda: Mengapa mengoptimumkan perkara niat carian Memikirkan semula Strategi Kata Kunci Anda: Mengapa mengoptimumkan perkara niat carian Jun 20, 2025 am 10:20 AM

Enjin carian terus berkembang, tetapi strategi SEO gagal bersaing. Selama bertahun -tahun, kami telah bergantung pada penyelidikan kata kunci untuk memilih carian khusus untuk disasarkan. Walau bagaimanapun, penyelidikan kata kunci sering mengutamakan matlamat yang salah. Dilaksanakan dengan baik, Keyw

Peringatan: Dasar Penyalahgunaan Reputasi Carian Google Baru bermula tidak lama lagi Peringatan: Dasar Penyalahgunaan Reputasi Carian Google Baru bermula tidak lama lagi Jun 28, 2025 am 10:22 AM

Dasar spam carian baru Google yang mengelilingi penyalahgunaan reputasi - taktik yang sering disebut "Parasite SEO" oleh profesional SEO - akan berkuatkuasa "selepas 5 Mei," seperti yang disahkan oleh Google. 5 Mei jatuh pada hari Ahad ini. Ini tidak dijangka. Kembali pada bulan Mac, pergi

Scamper cara anda untuk lebih baik SEO dan idea pemasaran kandungan Scamper cara anda untuk lebih baik SEO dan idea pemasaran kandungan Jun 18, 2025 am 09:47 AM

Terdapat banyak kandungan di luar sana. Dan teka apa? 99% daripadanya amat mengerikan. Kemudian, terdapat 1% kandungan - yang benar -benar baik untuk barangan yang benar -benar fenomenal. Kadang -kadang, itu berita panas, seperti kebocoran carian Google baru -baru ini, tetapi ada ALS

Pro dan Konsep SEO HubSpot vs WordPress vs. Webflow Pro dan Konsep SEO HubSpot vs WordPress vs. Webflow Jun 17, 2025 am 11:58 AM

Saya dapat bertanya sepanjang masa platform web yang harus digunakan oleh seseorang. Pilihan utama ialah HubSpot, WordPress dan Webflow. Jawab soalan yang sama beberapa kali, dan mungkin bernilai mengeja untuk orang ramai. Sebelum saya menerangkan pendekatan saya untuk menjawab t

Google bukan mengenai pautan biru, kata bekas CEO Eric Schmidt Google bukan mengenai pautan biru, kata bekas CEO Eric Schmidt Jun 27, 2025 am 09:25 AM

"Google bukan mengenai pautan biru. Ini mengenai menganjurkan maklumat dunia," kata bekas pengerusi eksekutif dan Ketua Pegawai Eksekutif Google Eric Schmidt semasa penampilan baru -baru ini di CNBC.When bertanya mengenai "Blue Link Economy" dan semua jenama dan perniagaan

See all articles