Sử dụng dữ liệu có cấu trúc để tạo một web tốt hơn về mặt ngữ nghĩa
Admin 22:14 01-07-2019 881
Một trong những phát triển thú vị hơn trong thế giới SEO trong những năm gần đây là sự tăng trưởng và phát triển của đánh dấu ngữ nghĩa và dữ liệu có cấu trúc.
Một trong những phát triển thú vị hơn trong thế giới SEO trong những năm gần đây là sự tăng trưởng và phát triển của đánh dấu ngữ nghĩa và các công nghệ liên quan.
Thật là chóng mặt khi nghĩ đến tiềm năng đầy đủ của một Semantic Web thực sự - giấc mơ về một mạng lưới thông tin được kết nối có ý nghĩa đang trôi nổi bên lề của web ngay từ khi bắt đầu. Nhưng các ứng dụng thực tế gần đây của tổ chức ngữ nghĩa, từ Sơ đồ web đến Schema.org đến AI đằng sau tìm kiếm bằng giọng nói, dường như đã chỉ ra một số đường đi theo hướng đó.
Có lẽ chúng tôi không tạo ra một Semantic Web bao gồm tất cả; có lẽ đó là một cái gì đó giống như một trang web được cải tiến dần về mặt ngữ nghĩa, trong đó kiến trúc cũ không bị thay thế nhiều như được tăng cường bởi cái mới. Nhưng nó vẫn rất tuyệt.
Tôi rất vui khi thấy rằng các sự kiện SMX năm nay đã liên tục đưa ra các phát triển về đánh dấu cấu trúc và các chủ đề khác mà người ta có thể xếp vào loại ngữ nghĩa trong tự nhiên. Sự Kiện tại SMX Advanced với Schema & Structured Data, được lưu trữ bởi Chris Sherman và được trình bày bởi Cata Milos, quản lý chương trình cao cấp tại Microsoft và Max Prin, trưởng phòng kỹ thuật SEO tại Merkle.
Bing cũng muốn dữ liệu có cấu trúc của web bạn
Không có gì ngạc nhiên khi Bing đã chấp nhận đánh dấu dự liệu có cấu trúc với tốc độ nhanh và theo cách phản ánh cách tiếp cận của Google. Xét cho cùng, Microsoft là một thành viên của tập đoàn, cùng với Google, Yahoo và Yandex, đã tạo ra Schema.org ngay từ đầu. Nhưng do nhiều SEO có thể dành ít thời gian để suy nghĩ về Bing hơn Google, đáng để nhắc nhở rằng việc đánh dấu dữ liệu có cấu trúc là vấn đề quan trọng đối với Bing - và rằng, mặc dù hai công cụ xử lý đánh dấu như vậy theo cùng một cách, có một số điều đáng chú ý sự khác biệt
Milos giải thích rằng Bing đã trải qua một sự chuyển đổi trong những năm gần đây từ việc nghĩ về web về HTML sang suy nghĩ về web một cách trực quan. Quan điểm HTML là phù hợp, ông nói, khi web nặng văn bản hơn nhiều và ở đó phần lớn thông tin được truyền đạt trên các trang web có thể được chắt lọc một cách hợp lý vào nội dung văn bản của nó. Nhưng ngày nay, với việc sử dụng rộng rãi CSS, JavaScript và nội dung đa phương tiện như hình ảnh và video, thông tin được truyền đạt theo cách trực quan hơn nhiều. Để đối phó với sự thay đổi này, quy trình lập chỉ mục web của Bing hiện hiển thị các trang web để chúng có thể được kiểm tra trực quan và không còn chỉ dựa vào mã HTML.
Milos đã có một số khuyến nghị về cách xây dựng nội dung web để Bing có thể hiểu đúng về nó, tất cả chúng đều dựa trên ý nghĩa cơ bản về định hướng thị giác này. Ông khuyến nghị chúng ta nên nghĩ về cách con người áp dụng sự hiểu biết trực quan vào các tài liệu phức tạp. Độc giả của con người được đào tạo để tìm kiếm các yếu tố quan trọng như tiêu đề, tác giả, văn bản và hình ảnh và được đào tạo để bỏ qua nội dung thứ cấp như liên kết bổ sung, quảng cáo, điều hướng trang web và các nút phương tiện truyền thông xã hội. Với những kỳ vọng này, các trang web nên được xây dựng theo cách sao cho nội dung chính có thể được xác định rõ ràng và nội dung thứ cấp bị phân tâm tối thiểu.
Milos đã đề xuất đánh dấu HTML5 như một cách tuyệt vời để gắn thẻ nội dung trang theo ngữ nghĩa, vì HTML5 chứa các thẻ như <title>, <nav>, <article> và <footer> cho phép bạn xác định nội dung trang theo cách có ý nghĩa nội tại đối với trình duyệt, nhà phát triển, công cụ tìm kiếm và độc giả.
Trên thực tế, Milos lưu ý rằng 45% tài liệu được lập chỉ mục hàng đầu của Bing có chứa các thẻ ngữ nghĩa HTML5, cho thấy rằng Bing hiện có thể đang đặt mức độ tin cậy cao hơn vào các thẻ ngữ nghĩa so với Google.
Ngay cả các thành phần HTML cơ bản như thẻ đoạn văn và tiêu đề cũng nên được sử dụng theo mục đích ngữ nghĩa của chúng, theo Milos. Các nhà phát triển web nên tránh sử dụng các thẻ <div> hoặc <span> một cách bất cẩn để ủng hộ các thẻ <p> để đánh dấu các đoạn văn và các thẻ <h1> đến <h6> nên được sử dụng với các mức giảm dần chính xác, phù hợp với mức độ nhấn mạnh và tầm quan trọng của hình ảnh tiêu đề. Các thẻ như <Table> và <list> chỉ nên được sử dụng khi tạo bảng hoặc danh sách, chứ không phải cho định dạng trang hoặc các mục đích khác.
Sử dụng đánh dấu theo các khuyến nghị này, theo Milos, sẽ cải thiện cơ hội cho nội dung của bạn xuất hiện trong các đoạn trích đặc trưng của Bing trong vị trí số 0 không tìm kiếm, trong các đoạn trích xuất hiện bên dưới liên kết trong các kết quả tìm kiếm cụ thể. Đặc biệt ấn tượng trong Bing SERPs là kết quả phong phú trong đó Bing sử dụng các tiêu đề phần kết hợp với các yếu tố như đánh dấu danh sách để tạo nội dung có cấu trúc hai cấp bên dưới liên kết tìm kiếm chính, như được hiển thị trong ảnh chụp màn hình bên dưới.
Đối với các loại đánh dấu ngữ nghĩa cụ thể theo chủ đề khác, Milos lưu ý rằng Bing hiểu tất cả các định dạng phổ biến bao gồm Schema.org, RDFa và OpenGraph, nhưng có xu hướng thích đánh dấu Schema.org ở định dạng JSON-LD hoặc Microdata, với một ưu tiên nhỏ hướng tới phiên bản JSON-LD ngày càng phổ biến.
Đánh dấu Schema.org là rõ ràng trong kết quả tìm kiếm Bing hiển thị các yếu tố như xếp hạng phim và tín dụng; xếp hạng công thức, danh mục và thời gian nấu ăn; và quyền tác giả bài viết. Đáng chú ý, Google đã ngừng tham khảo thẻ tác giả vài năm trước, nhưng Bing vẫn tiếp tục sử dụng chúng.
Mọi người suy nghĩ thế nào ?
Max Prin, trong phần trình bày của mình, đã khuyến khích khán giả nghĩ xa hơn các mục tiêu SEO truyền thống khi đánh giá các trường hợp sử dụng và số liệu thành công cho đánh dấu có cấu trúc. Chẳng hạn, ông lưu ý rằng một số SEOer có thể nhận ra rằng việc giành được vị trí trong các đoạn trích nổi bật có thể có nghĩa là sự sụt giảm lượt xem trang, lượt nhấp và doanh số quảng cáo. Xét cho cùng, các kết quả không nhấp chuột khác như thế khuyến khích người dùng ở lại trang tìm kiếm bằng cách cung cấp câu trả lời cho câu hỏi của họ và loại bỏ nhu cầu truy cập bất kỳ trang web nào.
Nhưng Prin đề xuất rằng mục tiêu (đối với nhiều trang web) phải là chuyển đổi, không chỉ là lượt xem trang hoặc TLB và các đoạn trích đặc trưng có thể dẫn đến chuyển đổi theo các đường dẫn khác, chẳng hạn như tạo nhận thức và niềm tin hàng đầu về thương hiệu. Ông đã trích dẫn ví dụ của Sixt, một công ty cho thuê xe hơi đã nhắm mục tiêu thành công vào vị trí đoạn trích đặc trưng với mục tiêu tăng tiền thuê xe và đi xe, chứ không phải lượt xem trang và TLB.
Hơn nữa, các đoạn mã phong phú làm tăng kết quả tìm kiếm trên thực tế thường tương quan với TLB cao hơn, thực tế giờ đây có thể đo lường được dễ dàng hơn do có thêm các kết quả mới của Rich Rich và Theo phân tích của Merkle, hầu hết các trang web sử dụng đánh dấu có cấu trúc sẽ thấy sự tiếp xúc nhiều hơn trong tìm kiếm so với các trang web không sử dụng đánh dấu có cấu trúc. Hơn nữa, xếp hạng cao hơn trong các đoạn nội dung phong phú có xu hướng cải thiện đáng kể TLB, trong khi các yếu tố khác có thể cải thiện hoặc làm tổn thương TLB tùy thuộc vào ngữ cảnh. Ví dụ, giá có thể cải thiện TLB cho các mặt hàng rẻ hơn nhưng giảm TLB cho các mặt hàng đắt hơn.
Prin lưu ý rằng mặc dù Schema.org định nghĩa khoảng 600 loại lược đồ, Google được cho là chỉ lập chỉ mục 30 trong số đó. Ông dẫn lời một nhà phát triển, trong một bài đăng trên Twitter, bày tỏ thái độ chung: Sốt Chúng tôi không có tài nguyên dành cho nhà phát triển để làm bất cứ điều gì không được Google hỗ trợ.
Nhưng Prin cho rằng suy nghĩ như vậy có thể là thiển cận. Chẳng hạn, Gary Ilyes của Google đã nói rằng Schema, nói chung, giúp Google định hiểu nội dung trên trang, và John Mueller đã nói rằng Schema Schema có thể giúp chúng tôi trích xuất các thực thể tốt hơn. Nói tóm lại, Google có thể đang thực hiện sử dụng rộng rãi các loại Schema hơn những gì rõ ràng thông qua các bằng chứng như đoạn trích phong phú.
Bất kể ý nghĩa đằng sau những manh mối mơ hồ này, tôi sẽ nói rằng việc sử dụng rộng rãi hơn các loại Schema cũng có thể giúp chứng minh nội dung của bạn trong tương lai vì sự thèm ăn của Google đối với dữ liệu có cấu trúc dường như đang mở rộng.
Thật vậy, như một ví dụ về việc mở rộng các trường hợp sử dụng và ứng dụng để đánh dấu ngữ nghĩa, Prin đã đề cập đến kết quả tìm kiếm bằng giọng nói của Google Assistant, lưu ý rằng chúng tôi biết các đoạn trích đặc trưng đang được sử dụng trong kết quả thoại ngày hôm nay, mặc dù không có dữ liệu nào về tần suất xảy ra Ông cũng đề cập rằng đánh dấu có thể nói tiếng Anh hiện đang được thử nghiệm bởi Google; đánh dấu như vậy sẽ chỉ ra cho một giao diện giọng nói rằng nội dung được dự định sẽ được nói to.
Bên cạnh đó, tôi tò mò liệu có thể nói tiếng Anh hay không, mở ra khả năng xuất bản các biến thể của nội dung văn bản, chẳng hạn như một phiên bản chi tiết hơn dành cho việc đọc và một phiên bản đơn giản hơn, ngắn gọn hơn được thiết kế cho giọng nói. Nếu nó trở nên phổ biến để tạo ra các biến thể như vậy, một tác dụng phụ thú vị là nhiều trang web phức tạp sẽ bao gồm các bản tóm tắt nội dung của chúng, có thể hữu ích cho các mục đích khác.
Cuối cùng, Prin đưa ra một số ý tưởng về cách đánh dấu ngữ nghĩa có thể được sử dụng để phân tích rộng hơn về tác động kinh doanh. Vì đánh dấu ngữ nghĩa mang lại cho bạn lợi ích thứ yếu của việc tổ chức nội dung của bạn theo các thẻ có ý nghĩa như giá cả hoặc ngày xuất bản, nên bạn có thể nhóm nội dung theo các thẻ này và tương quan với các điểm dữ liệu khác, ví dụ, để xác định điểm xem bỏ qua cho nội dung cũ hơn hoặc để kiểm tra mối tương quan giữa giá và TLB.
Điểm nổi bật của phiên là dữ liệu có cấu trúc sẽ tiếp tục tăng tầm quan trọng khi Bing và Google làm việc để mở rộng sử dụng thực tế. Theo cả hai người thuyết trình, họ phải trả giá cho cả việc tích cực và sáng tạo trong việc sử dụng đánh dấu có cấu trúc của bạn, vượt ra khỏi ranh giới của các trường hợp sử dụng thông thường và mã hóa bằng con mắt hướng tới công nghệ mới nổi, đặc biệt là tìm kiếm bằng giọng nói. Trong tất cả những điều này, quan điểm của những người thuyết trình phù hợp một cách đáng khích lệ với quan niệm rằng một trang web được cải tiến về mặt ngữ nghĩa đang dần ra đời.