Nền tảng Blogger (Blogspot) đang dần mất đi số lượng người dùng đáng kể nhưng một số blog còn lại vẫn chứa những nội dung có giá trị tốt. Việc lấy cắp dữ liệu data Blogspot tuy không còn mới nhưng có rất nhiều bạn vẫn không hề biết đến thủ thuật này.
Hầu hết cách lấy dữ liệu nội dung Blogspot đều dựa vào việc xem và copy các nội dung thông qua tính năng RSS – ATOM (Nguồn cấp dữ liệu bài đăng của trang web Blogspot). Chính vì vậy, nếu muốn ngăn chặn việc copy hay lấy cắp nội dung data Blogspot thì chúng ta cần can thiệp để ngăn chặn từ phần RSS này.
- Hướng dẫn thay đổi template blogspot của website
- Hướng dẫn rip template blogspot hiệu quả nhất
- Template giới thiệu bản thân blogspot dùng làm CV
Có nên lấy cắp dữ liệu Blogspot của người khác?
Việc ăn cắp nội dung là vi phạm bản quyền chất xám của người khác và nó hoàn toàn không tốt với bất kỳ lý do gì. Tuy nhiên, trong một số trường hợp mà bạn cần phải lấy dữ liệu bài viết của những mẫu giao diện Blogspot thì nên áp dụng cách lấy dữ liệu bài viết ngay dưới đây.
Trước đây, việc đánh cắp nội dung cũng từng có hiệu quả đối với SEO và bài viết copy vẫn lên top được nhưng sau đợt update Google vừa rồi thì các nội dung copy sẽ không còn có thể lên top như trước được nữa. Và nó cũng kéo theo sự đi xuống của một trang web vì vậy nếu Blogspot của bạn chỉ là trang mẫu thì có thể áp dụng còn nếu là blog đang dùng thì không nên.
Tóm lại, việc lấy data Blogspot của một giao diện Blogspot demo thì có thể nhưng để sử dụng nội dung đó cho blog bạn đang dùng và tâm huyết với nó thì tuyệt đối không nên.
Cách lấy dữ liệu của một trang Blogspot bất kỳ
Để có thể thực hiện việc copy toàn bộ nội dung của một trang web Blogspot bất kỳ thì bạn thực hiện các bước sau đây:
Bước 1: Xác định xem trang Blogspot đó có tất cả bao nhiêu bài viết.
Đa số các blog được xây dựng trên nền tảng Blogspot (Blogger) đều được xây dựng bởi cá nhân nên các bài viết cũng như dữ liệu sẽ không nhiều. Tuy nhiên, một số trang blog khác có thể nhiều bài viết hơn nhưng thông thường cũng không cao lắm.
Chính vì vậy, bạn không cần lo lắng về việc cần phải biết quá chính xác về số liệu này. Vì cùng lắm số lượng content (nội dung) sẽ đâu đó tầm từ 100 đến 2000 bài viết mà thôi.
Bước 2: Lấy dữ liệu blog thông qua ATOM.
Theo quy định, mỗi lần lấy dữ liệu thông qua RSS sẽ không quá 500 liên kết bài đăng nên nếu có nhiều hơn 500 bài viết thì sẽ có nhiều lần lấy dữ liệu khác nhau. Hãy quan sát kỹ liên kết dưới đây.
http://tenblogcuaban.blogspot.com/atom.xml?redirect=false&start-index=X&max-results=Y
- Phần “tenblogcuaban” được bôi đen chính là phần thay thế cho địa chỉ blog cần lấy dữ liệu.
- X và Y được bôi đen ở phần cuối liên kết quy định cho số bài viết cần lấy. Số lần lấy sẽ là từ 1 – 500, từ 500 – 1000, và từ 1000 – 1500,…
- Cứ như vậy, nếu số lượng bài viết nằm trong khoảng từ 1 đến 500 bài viết thì bạn sẽ có chuỗi liên kết là “http://tenblogcuaban.blogspot.com/atom.xml?redirect=false&start-index=1&max-results=500“. Và nếu số lượng bài viết nhiều hơn 500 thì chuỗi liên kết sẽ là “http://tenblogcuaban.blogspot.com/atom.xml?redirect=false&start-index=500&max-results=1000“. Tương tự như vậy, bạn có thể áp dụng bao nhiêu bài viết cũng được.
Bước 3: Dán liên kết lên thanh trình duyệt.
Sau khi có chuỗi liên kết ở bước 2 thì việc tiếp theo là dán các địa chỉ đó lên thanh trình duyệt và bấm ‘Enter”.
Khi đó, trên màn hình sẽ xuất hiện một trang web có nền trắng và các ký tự lộn xộn (mã nguồn XML). Bạn click chuột phải vào phần trang web đó và bấm “Lưu thành” hoặc “Save As” tùy thuộc ngôn ngữ trình duyệt.

Tiếp đến, đặt tên của file vừa được lưu dưới dạng .XML (phần File name) và chọn thuộc tính là All Files (Phần Save as type). Sau đó bấm “Save” để lưu lại.

Như vậy, chúng ta đã có file chứa dữ liệu bài viết của blog kia. Tiếp theo, nếu bài viết đó có nhiều bài viết thì bạn thực hiện nhiều lần như vậy, chúng ta sẽ đặt các file dữ liệu tương tự như vậy.
Bước 4: Import dữ liệu vào blog
Cuối cùng, để upload file dữ liệu này lên blog của mình hay blog dùng để làm mẫu thì bạn thực hiện như sau:

Truy cập vào phần “Cài đặt” của Blogspot. Sau đó tìm đến phần “Quản lý blog” chọn tiếp “Nhập nội dung“. Bấm “Nhập” tiếp đến “Chọn File” để upload lên là được.
Việc lấy cắp một tất cả nội dung của một trang Blogspot quá dễ dàng vì vậy nếu bạn là một chủ blog (webmaster) thì nên tìm hiểu thêm cách ngăn chặn lấy cặp dữ liệu ngay sau đây để bảo vệ tốt hơn cho nội dung của mình.
Cách ngăn chặn lấy cắp dữ liệu bài viết Blogspot
Để ngăn chặn hay chống ăn cắp dữ liệu bài viết trên blog thì bạn thực hiện các bước sau đây.
Vào phần “Cài đặt” của Blogspot. Tìm đến mục “Cho phép nguồn cấp dữ liệu blog” sau đó chọn “Cho đến dấu nhảy ngắt đoạn“. Cuối cùng bấm “Lưu lại“.

Khi đăng bài, bạn chú ý thêm dấu ngắt đoạn để khi người khác lấy cắp nội dung sẽ chỉ hiển thị tiêu đề và phần mở đầu phía trên dấu ngắt thôi.
Nếu như bạn chưa biết, nút thêm “Dấu nhảy ngắt đoạn” sẽ có dạng dấu (-) trên thanh công cụ soạn thảo của Blogspot như hình.

Như vậy là xong.
Kết luận
Việc lấy cắp dữ liệu Data Blogspot không khó nhưng việc ngăn chặn cũng khá dễ dàng. Nếu bạn đang xây dựng một trang blog tâm huyết trên Blogspot thì nên áp dụng ngay mẹo hay này để bảo vệ chất xám và nội dung của mình.
Tham khảo thêm: