40
0
SEO

Hướng dẫn chi tiết Audit Content từ A -Z (Phần 1)

40

Nếu nhắc đến content, bạn hẳn sẽ không còn xa lạ. Nhưng khi nhắc đến audit content mình tin chắc rằng có nhiều người, kể cả SEOer và Marketer “newbie” sẽ cảm thấy khá lạ lẫm. Hầu hết các dự án tại GTV SEO đều được triển khai audit content ở giai đoạn đầu, đối với những dự án có nhiều content bị lỗi sau khi chỉnh xong thì lượng traffic tăng trưởng gấp 2-3 lần chỉ trong vòng khoảng từ 3-4 tháng đầu. Vậy audit content là như thế nào, quan trọng ra sao, không phải ai cũng nắm vững được. Trong bài viết này, mình sẽ hướng dẫn bạn quy trình làm content audit cho website một cách chi tiết nhất. Vì nội dung của bài viết khá dài nên mình sẽ chia làm 2 Phần. Phần 1 của bài viết mình sẽ giải thích cho bạn hiện audit content là gì? phương pháp để lấy và lọc dữ liệu để điền vào file excel.

Phần 2 sẽ được đăng trong các bài viết sắp tới, mình sẽ hướng dẫn bạn cách phân loại, đưa ra giải pháp hành động để cải thiện content trên website. Nhưng trước hết, mình sẽ giúp bạn hiểu nhanh những khái niệm liên quan đến audit content. Bắt đầu nhé!

1. KHÁI NIỆM AUDIT CONTENT

Content Audit, hay audit content cũng tương tự vậy, là quá trình phân tích tổng quan content của một website. Việc audit content giúp thay đổi toàn diện chất lượng content của website, cung cấp thêm nhiều giá trị cho người đọc đồng thời tăng chất lượng website, cải thiện thứ hạng trên công cụ tìm kiếm. Mình sẽ đi cùng bạn từng bước một và chi tiết nhất có thể.

2. NHẬN DIỆN CONTENT CẦN CẢI THIỆN

Tùy theo sản phẩm và user intent mà mỗi trang web sẽ lựa chọn phong cách content khác nhau. Tuy nhiên, nhìn chung, có 5 loại content mà mọi website đều cần phải tránh:

Hình 1: Những content cần được cải thiện trên web

a. Content kém chất lượng

Thế nào là content kém chất lượng, mình sẽ giải đáp cho bạn ngay sau đây:

  • Content không có người truy cập vào xem trong khoảng thời gian dài (trên 4 tháng) hoặc không xếp hạng từ khóa nào cả.
  • Content trùng lặp nội dung sẽ dẫn đến tình trạng cannibalization – những bài viết cùng chủ đề tự cạnh tranh lẫn nhau.
  • Content chưa được tối ưu tốt do bạn chưa nghiên cứu người dùng, outline chưa tốt, chưa xác định đúng user intent.
  • Content target không đúng từ khóa. Ví dụ bài viết thông tin lại target từ khóa dịch vụ.

b. Thin content

  • Duplicate content nội bộ khi copy một hoặc một số bài viết trên domain của bạn.
  • Duplicate content bên ngoài khi copy một hoặc một số bài viết trên domain của người khác.
  • Không hẳn là duplicate 100% nhưng trùng 70-80%.
  • Trang gần như không có content mà chỉ có menu, footer và sidebar.
  • Trang có quảng cáo nhiều hơn content.

Tuy nhiên một số trang sản phẩm của thương mại điện tử buộc phải duplicate content hoặc viết content ngắn, như thị trường máy tính, chuột, bàn phím sẽ có content là thông số chính xác. Nhiều content buộc phải duplicate lớn (ít nội dung) chẳng hạn content về doanh nghiệp như trang liên hệ, tuyển dụng.

c. Content không liên quan

Thông thường website có 3 dạng content chính là:

  • Content chủ lực: chiếm 75%
  • Content bổ trợ: 20%
  • Content đang lên (trending trong lĩnh vực): 5%.

Ví dụ: website của GTV có content chính là SEO (Search Engine Optimization) và inbound marketing chiếm 75%, nội dung hỗ trợ liên quan đến social media marketing và doanh nghiệp chiếm 20% và topic khác như blockchain.Vậy content không liên quan khi:

  • Content không liên quan đến chủ đề mà doanh nghiệp bạn đang quan tâm.
  • Tỷ lệ content bổ trợ và content đang lên quá nhiều.
  • Content không mang lại giá trị cho doanh nghiệp.

d. Under performance content

Là những content:

  • Đang nằm top 6-20 (đôi khi là 6-25)
  • Trước đó có traffic tốt nhưng vì những lý do như Google update hay đối thủ cạnh tranh mạnh khiến traffic giảm so với trước.

e. High traffic content

Lạ đúng không, tại sao content có traffic cao lại cần audit. Đơn giản thôi, tốt không có là hoàn hảo. High traffic content đang có nhiều lượng truy cập và nếu được tối ưu tốt sẽ có nhiều traffic hơn nữa.Hoặc trang có high traffic content nhưng bounce rate cao thì bạn cũng nên có một số giải pháp để cải thiện.

CÁC BƯỚC AUDIT CONTENT

Nhập dữ liệu

Đầu tiên bạn cần truy cập Screaming Frog và tiến hành mua tài khoản để có thể sử dụng những tính năng quan trọng giúp audit content.

Hình 2: Bản trả phí sẽ có nhiều tính năng hữu ích hơn

Sau khi mua tài khoản hoàn tất, bạn chỉ cần tải Screaming Frog và tiến hành đăng nhập.Để thiết lập cài đặt chuẩn cho Screaming Frog, chọn Configuration → Spider → Basic và nhấp chọn những cài đặt như hình sau:

Hình 3: Nhấn chọn cài đặt Scream Frog theo hướng dẫn

Ở tab Render, bạn chọn Old AJAX Crawling Scheme. Tiếp tục thiết lập cài đặt tab Advanced như hình sau:thiết lập cài đặt advanced

Hình 4: Nhấn chọn Advanced theo hướng dẫn trên

Những tab còn lại để mặc định.

Một số cài đặt khác:

  • Configuration → robots.txt → Setting → Respect robots.txt → Show internal URLs blocked by robots.txt → OK.
Hình 5: Hướng dẫn chọn robots.txt
  • Configuration → User Agent→ Googlebot Smartphone (do thuật toán Google sẽ ưu tiên cào phiên bản mobile trước)
Hình 6: Hướng dẫn chọn thuật toán crawl điện thoại

Vậy là bạn đã hoàn thành bước cài đặt Screaming Frog cơ bản.Tiếp theo chúng ta sẽ mở rộng chức năng của công cụ bằng việc kết nối với API của Search Console (trước đây là Webmaster tool) và khai báo google analytics.Nếu bạn chưa biết thì mình sẽ nói sơ qua Google Search Console là gì?Search Console là công cụ cho biết tình trạng, hiệu suất của website trong khi Google Analytics tập trung phân tích các đối tượng user và traffic.Để kết nối API, bạn vào Configuration → API Access → Google Analytics → Nhập account vào khung existing account → Connect to new account → Chọn account quản lý GA → Cho phép.

Hình 7: Làm theo ảnh để kết nối Google Analytics với Screaming Frog nhé

Vậy là Screaming Frog đã được kết nối thành công với GA. Bạn có thể chọn tiếp dự án ở mục Property, Chế độ xem và Organic Traffic.Thao tác tương tự khi muốn kết nối với Search Console.Ngoài ra ở hai công cụ này, bạn lưu ý chọn khoảng thời gian tại tab Date Range. Ở đây bạn nên chọn thời gian khảo sát từ 3 tháng trở lên để có đủ dữ liệu phân tích.

Hình 8: Thời gian khảo sát từ 3 tháng trở lên đầy đủ dữ liệu để phân tích

Vậy là xong bước kết nối. Để lấy dữ liệu từ Screaming Frog, bạn nhập domain website vào thanh tìm kiếm rồi chọn Start.

Hình 9: Giao diện Screaming Frog

Bạn có thể theo dõi tiến độ cào qua thanh Crawl. Tốc độ crawl nhanh hay chậm còn tùy theo cấu hình máy và chất lượng wifi. Sau khi công cụ chạy xong, bạn có thể tiến hành export file excel tất cả dữ liệu. Lúc này, công cụ filter của excel sẽ là trợ thủ đắc lực giúp bạn phân loại và thu hẹp phạm vi khảo sát. Hãy lọc theo những tiêu chí cơ bản sau:

  • Cột content: chọn đối tượng phân tích là hình ảnh hay content chữ. Ví dụ, giữ lại những ô có chứa text khi chỉ muốn audit content. (Hình 10)
  • Cột Status: giữ lại những ô có trạng thái 200, vì những URL lỗi 404, 500 hay redirect 301 không phải đối tượng chính để phân tích content. (Hình 11)
  • Cột Indexability: xóa những ô Non-index. (Hình 12)
Hình 10
Hình 11
Hinh 12

Sau khi lọc xong dữ liệu, bạn chỉ để lại những cột sau:

  • Address
  • Title
  • Meta description
  • H1
  • Word count
  • GA Session
  • GA New User
  • Bounce rate
  • GA Avg Session
  • Clicks
  • Impressions
  • Position.

Chuyển qua sheet Content phân loại, bạn cần nắm được những thông tin sau:

  • URL Thin Content

Sau khi lọc dữ liệu lần 2, hãy sắp xếp trang theo Word count từ thấp đến cao. Bài viết từ 800 từ trở xuống sẽ được đánh già là Thin Content. Tức là nội dung quá ngắn, không đảm bảo chất lượng, cần cải thiện. Trừ trường hợp số từ trang chủ thấp thì không phải vấn đề lớn.

Lưu ý: word count trong Screaming Frog dựa trên số lượng chữ tính trong code nên sẽ count luôn tất cả các chữ của thanh menu, sidebar, footer … có trên website. Do đó để bài viết đạt chất lượng content unique 800 chữ trở lên thì word count phải trên 1000 từ. Tuy vậy, bạn cũng cần cân nhắc đến user intent vì không phải website nào cũng cần content quá dài.

  • Duplicate content

Duplicate content là một trong những lỗi content nghiêm trọng ảnh hưởng đến hiệu quả SEO website.Screaming Frog có thể phát hiện lỗi duplicate ở title, meta description và H1.

Hình 13: Screaming Frog giúp phát hiện Duplicate Content nhiều vị trí khác nhau
  • Content under performance

Một tiêu chí khác cần đưa vào file dữ liệu là content under performance, để lọc những bài viết có keyword tiềm năng xếp hạng tốt. Dữ liệu này có thể xuất từ này từ Ahrefs và Search Console nhưng mình vẫn thích lấy từ Search Console hơn. Vậy dữ liệu từ Ahrefs và Search Console khác nhau như thế nào? Với Ahrefs, ví dụ URL A bất kỳ của bạn đang rank 372 từ khóa nhưng kết quả sẽ chỉ hiển thị hiệu suất của từ khóa cao nhất.

Hình 14: Trong khi Search Console sẽ tính trung bình performance của 372 từ khóa để đưa ra kết quả top page nên sẽ khách quan hơn.

Hình 14: Trong khi Search Console sẽ tính trung bình performance của 372 từ khóa để đưa ra kết quả top page nên sẽ khách quan hơn.

Hình 15: Search Console tính ra kết quả trung bình của các từ khóaĐể chọn Top pages trong Search Console, bạn sẽ lọc dữ liệu theo cột Position cuối cùng trong sheet, chỉ lấy thứ hạng từ 5-20.

Hình 15: Search Console tính ra kết quả trung bình của các từ khóaĐể chọn Top pages trong Search Console, bạn sẽ lọc dữ liệu theo cột Position cuối cùng trong sheet, chỉ lấy thứ hạng từ 5-20.

Hình 16: Cách lọc content under performance.Number Filter > Between và nhập từ 5 đến 20 để chọn các content under performance.

Hình 16: Cách lọc content under performance.Number Filter > Between và nhập từ 5 đến 20 để chọn các content under performance.
  • URL có xu hướng giảm

Sau khi quan sát kết quả traffic trên Ahrefs và Google Analytics, bạn lọc ra những URL có xu hướng để phân tích sâu hơn và đưa ra giải pháp cải thiện để lên top trở lại. Trong sheet content audit, bạn bắt đầu nhập những thông tin cụ thể đã xuất và lọc được bao gồm URL, Action, Loại content, Title, Word count, RD, GA Session, GA Bounce rate, GA time onsite, Clicks, Impressions và Position.

Hình 17

RD là referring domains, bạn có thể lấy dữ liệu từ Ahrefs → Best by links → Export → Dùng vlookup để tìm RD với URL tương ứng trong sheet Content audit. Như vậy là các bạn đã cùng mình đi hết nội dung của phần 1 rồi. Nội dung của phần 2 mình sẽ hướng dẫn bạn cách phân loại, đưa ra giải pháp hành động để cải thiện content trên website.

Nguồn: Anh Đỗ Anh Việt – CEO GTV SEO