55
Ti ưu hóa trang web dn24h.com cho công ctìm kiếm GOOGLE Trang:1 Chương 1: Tng quan CHƯƠNG I:

đồ án luận văn tốt nghiệp khoa công nghệ thông tin SEO website dn24h.com lên top google

Embed Size (px)

Citation preview

Page 1: đồ án luận văn tốt nghiệp khoa công nghệ thông tin SEO website dn24h.com lên top google

Tối ưu hóa trang web dn24h.com cho công cụ tìm kiếm GOOGLE Trang:1

Chương 1: Tổng quan

CHƯƠNG I:

Page 2: đồ án luận văn tốt nghiệp khoa công nghệ thông tin SEO website dn24h.com lên top google

Tối ưu hóa trang web dn24h.com cho công cụ tìm kiếm GOOGLE Trang:2

Chương 1: Tổng quan

Chương 1: TỔNG QUAN

1.1. ĐẶT VẤN ĐỀ

Website – ngôi nhà của Doanh nghiệp trên Internet, nếu nói tên miền là bảng hiệu của

một Công ty thì website chính là văn phòng của Công ty đó, là nơi khách hàng tìm kiếm các

thông tin về doanh nghiệp trước khi kí hợp đồng, là nơi khách hàng và các đối tác liên hệ doanh

nghiệp, là bộ mặt của doanh nghiệp… Ngoài ra website còn tạo ra không ít lợi thế khác như:

- Hướng hoạt động của doanh nghiệp từ nội địa hoặc cục bộ ra toàn cầu.

- Website là nơi trưng bày, giới thiệu sản phẩm, hàng hóa dịch vụ của Doanh nghiệp. Hoạt động lên tục 24x7, không giới hạn thời gian và không gian.

- Website là kênh thông tin giới thiệu sản phẩm, dịch vụ hoàn hảo nhất và hữu dụng nhất với hình ảnh, các giới thiệu, các media…

- Website còn là một kho hàng khổng lồ, không giới hạn về sức chứa.

- Hơn cả, website là một kênh bán hàng tốn ít chi phí nhất.

Thông qua website, doanh nghiệp có thể tiếp thị hình ảnh, thương hiệu, dịch vụ, sản

phẩm của mình ra ngoài phạm vi, khu vực của quốc gia. Chính vì những lợi ích ấy, việc không

có website đã là một thiệt thòi so với các đối thủ cạnh tranh.

Theo Tổng cục Thống kê, tổng số người sử dụng Internet tại Việt Nam tính đến 2013 là

hơn39 triệu người, ( chiếm hơn 43.9% dân số Việt Nam) và hơn 8,5 triệu người dùng Internet

băng thông rộng (08/2014).

Trong giai đoạn 2000 - 2010, tỉ lệ tăng trưởng người sử dụng Internet tại Việt Nam đạt

mức 12%, tốc độ tăng trưởng nhanh nhất trong khu vực. Như vậy sau gần 14 năm kể từ ngày

Việt Nam gia nhập cộng đồng Internet toàn cầu (1/12/1997), lượng người sử dụng Internet trong

nước đã tăng nhanh một cách đáng kể.

Nhìn chung, Internet là một món ăn không thể thiếu với cuộc sống của mọi người, với

thói quen sử dụng các bộ máy tìm kiếm (Google, Bing, Yahoo…) để tìm kiếm thông tin về

doanh nghiệp, tài liệu học tập, mua sắm trực tuyến, nạp thẻ điện thoại, thanh toán hóa đơn…

Theo thống kê, có đến hơn 86% lượng truy cập của một website đều đến từ các Search

Engine lớn như Google, Yahoo, MSN… Mỗi ngày có hàng triệu người dùng lướt web sử dụng

Search Engine để tìm những sản phẩm, dịch vụ và thông tin họ đang cần.Nhưng liệu với hàng tỉ

website hiện đang tồn tại, làm sao khách hàng có thể tìm thấy website của bạn trước mà không

phải của các đối thủ cạnh tranh? Hầu hết người sử dụng các bộ máy tìm kiếm đều không kiên

nhẫn, họ chỉ tập trung vào các kết quả tìm kiếm ở “Trang nhất” trong hàng trăm, hàng triệu kết

quả trả về khi truy vấn tìm kiếm.

Page 3: đồ án luận văn tốt nghiệp khoa công nghệ thông tin SEO website dn24h.com lên top google

Tối ưu hóa trang web dn24h.com cho công cụ tìm kiếm GOOGLE Trang:3

Chương 1: Tổng quan

Như vậy, câu hỏi được đặt ra là: “làm sao giúp website có thể hiển thị được ở trang đầu

tiên khi người dùng truy vấn ?”

SEO – Search Enginee Optimization: tối ưu hóa công cụ tìm kiếm được đề xuất như là

một phương pháp hữu hiệu giúp website có vị trí cao tại trang kết quả truy vấn đầu tiên, giúp cho

người dùng dễ dàng tìm thấy kết quả nhất.

Chính vì đa phần người dùng đến 1 website đều thông qua công cụ tìm kiếm nên nếu bỏ

qua SEO đồng nghĩa với việc bạn mất tiền mỗi ngày cho website của đối thủ cạnh tranh.Không

người dùng nào đủ kiên nhẫn xem quá 3 trang kết quả sau khi thực hiện tìm kiếm trên SE.

Nếu website của bạn không nằm trong top 30 – top 10, khách hàng sẽ không hề biết

website của bạn tồn tại.

SEO là hoạt động không thể thiếu đối với bất kỳ trang web nào, nó là con đường để trở

thành một trang web được nhiều người biết đến.Các phương pháp quảng cáo truyền thống càng

bị bão hoà đối, chi phí cao nhưng hiệu quả lại giảm sút.Nhất là trong giai đoạn khủng hoảng hiện

nay, khi mà hiệu quả của việc quảng cáo phải được đặt lên hàng đầu.

SEO có rất nhiều ưu điểm so với các phương pháp quảng bá truyền thống như: người

dùng không phải độc thoại, có thể tiếp cận trao đổi thông tin trực tiếp; linh hoạt hơn trong phân

loại người dùng và đặc biệt là Webmaster có thể quản lý được thông tin khách hàng...Với rất

nhiều ưu điểm mà truyền hình, báo giấy... không có được, Internet sẽ luôn là lựa chọn hàng đầu.

1.2. LỊCH SỬ GIẢI QUYẾT VẤN ĐỀ

Webmaster và các nhà cung cấp dịch vụ SEO đã bắt đầu tối ưu hóa các trang web cho

công cụ tìm kiếm vào giữa những năm 1990. Ban đầu, các webmaster bắt đầu gửi link liên kết

hay url của trang web đến các công cụ tìm kiếm, các công cụ này sẽ gửi một spider đến trang

website đó, website sẽ được thu thập dữ liệu, sau đó được index lên máy chủ tìm kiếm, nơi đây

các thông tin về website sẽ được lưu trữ lại, các từ khóa của website, các link liên kết trong

website đó, các spider này sẽ làm việc index lên máy chủ theo lịch trình mà các công cụ tìm

kiếm quy ước. Người sở hữu trang web bắt đầu để nhận ra những giá trị của việc có các trang

web của họ và có thể nhìn thấy được xếp hạng cao trong kết quả công cụ tìm kiếm. SEO chia ra

làm hai dạng đó là : SEO truyền thống (White Hat SEO) và SEO gian lận (Black Hat SEO).

Theo nhà phân tích Danny Sullivan, cụm từ “Tối ưu hóa công cụ tìm kiếm” sử dụng rất

nhiều trên mạng vào năm 1997.

Đầu phiên bản của thuật toán tìm kiếm dựa vào quản trị trang web cung cấp thông tin như

các thẻ meta từ khoá, hoặc tập tin chỉ mục như ALIWEB. Thẻ meta cung cấp một hướng dẫn đến

nội dung của mỗi trang.

Page 4: đồ án luận văn tốt nghiệp khoa công nghệ thông tin SEO website dn24h.com lên top google

Tối ưu hóa trang web dn24h.com cho công cụ tìm kiếm GOOGLE Trang:4

Chương 1: Tổng quan

Sử dụng dữ liệu meta vào các trang chỉ mục được tìm thấy sẽ được ít hơn đáng tin cậy,

tuy nhiên, vì những sự lựa chọn của webmastermà các thẻ meta có sự chính xác trong khả năng

đưa thông tin website lên máy chủ tìm kiếm. Những dữ liệu không chính xác, không đầy đủ, và

không nhất quán trong thẻ meta có thể gây ra sự xếp hạng không đúng vị trí cho các tìm kiếm

không liên quan. Việc cung cấp nội dung được tối ưu hóa và một số thuộc tính trong mã nguồn

HTML đối với một trang web cần phải chính xác để có được kết quả tốt trên công cụ tìm kiếm.

Bằng cách dựa quá nhiều vào các yếu tố như mật độ từ khóa đó được độc quyền trong

vòng kiểm soát của một webmaster, công cụ tìm kiếm sớm bị lạm dụng vào thao tác xếp hạng.

Để cung cấp kết quả tốt hơn cho người dùng của họ, công cụ tìm kiếm đã phải thích ứng để đảm

bảo kết quả của các trang đã cho thấy các kết quả tìm kiếm có liên quan nhất, thay vì các trang

không liên quan nhồi với từ khoá nhiều bởi Black Hat SEO – nhóm Webmaster không bao giờ

tuân theo các qui định của các bộ máy tìm kiếm, họ luôn lạm dụng quá mức các thủ thuật. Các

công cụ tìm kiếm đã phản ứng lại bằng cách phát triển phức tạp hơn thuật toán xếp hạng, có tính

đến các yếu tố bổ sung mà gây nhiều khó khăn cho quản trị web để thao tác.

SEO tại Việt Nam bắt đầu những nền móng phát triển đầu tiên khoảng vào thời điểm giữa

năm 2006. Sau 5 năm, đến nay SEO đã là một khái niệm mà hầu như bất kì một nhà quản trị

website nào cũng biết đến và tìm hiểu nó dù ít hay nhiều. Thậm chí, SEO còn được đưa vào hoạt

động của công ty như một hướng đi chiến lược với những kế hoạch dài hơi. Điển hình, bạn có

thể dễ dàng nhận ra FPT có bộ phận SEO riêng, Zing có bộ phận SEO riêng, VCCORP cũng có

bộ phận traffic riêng, Báo điện tử 24h…

Như đã trình bày ở trên, hầu hết người làm SEO chỉ chú ý đến việc là sao để một website

Thương mại được lên trang nhất của bộ máy tìm kiếm. Vấn đề đặt ra: có thể áp dụng SEO cho

một website phi lợi nhuận, mang tính giáo dục và Cộng đồng không ? Liệu SEO cho một trang

web phi thương mại có khả năng thành công không…

Luận văn đề tài “Tối ưu website dn24h.com cho các công cụ tìm kiếm” là một minh

chứng cụ thể nhất cho việc áp dụng phương pháp SEO vào một website phi lợi nhuận, cộng đồng

cùng trao đổi học tập.

1.3. MỤC TIÊU CẦN ĐẠT ĐƯỢC

1.3.1. Về lý thuyết

Sau khi hoàn thành luận văn, sinh viên có các kĩ năng sau:

- Tìm hiểu bộ máy tìm kiếm.

- Hiểu thế nào là SEO, các biện pháp để tiến hành SEO một trang web.

1.3.2. Về ứng dụng

Page 5: đồ án luận văn tốt nghiệp khoa công nghệ thông tin SEO website dn24h.com lên top google

Tối ưu hóa trang web dn24h.com cho công cụ tìm kiếm GOOGLE Trang:5

Chương 1: Tổng quan

Sau khi áp dụng lý thuyết đạt được vào thực tiễn, sinh viên có được cách để:

- Đưa website vào top 3 của bộ máy tìm kiếm với từ khóa “diễn đàn đăk nông”

- Phương pháp duy trì top 10 khi seo đã thành công.

1.4 Phương pháp nghiên cứu và giải quyết vấn đề

Việc đầu tiên trước khi SEO một website đã được định hướng đúng đắn bằng

những ý tưởng độc đáo và mã nguồn tốt thì chúng ta phải biết được SEO là gì?Và các

phương pháp lựa chọn những thành phần hỗ trợ cho website đó.Một website được SEO tốt

khi và chỉ khi webmaster có được hiểu biết đúng đắn, tránh rơi vào tình trạng Black Hat

SEO.

Nhìn chung, quá trình nghiên cứu được phân thành 04 giai đoạn, các giai đoạn này được

thực hiện liên tục cho đến khi SEO thành công.

Page 6: đồ án luận văn tốt nghiệp khoa công nghệ thông tin SEO website dn24h.com lên top google

Tối ưu hóa trang web dn24h.com cho công cụ tìm kiếm GOOGLE Trang:6

Chương 2: Khảo sát hiện trạng

CHƯƠNG 2:

Page 7: đồ án luận văn tốt nghiệp khoa công nghệ thông tin SEO website dn24h.com lên top google

Tối ư

Chươ

2.1. Phư

tưởn

chọn

webm

thực

-

-

-

-

ưu hóa trang

ơng 2: Khảo

ương pháp

Việc đầu

g độc đáo v

n những thà

master có đư

Nhìn chu

hiện liên tụ

H

Bước 1: hỗ trợ ng

Bước 2: nguồn, tá

Bước 3:

Bước 4: sữa chữa

g web dn24

o sát hiện tr

p nghiên cứ

u tiên trước

và mã nguồ

ành phần h

ược hiểu biế

ung, quá trì

ục cho đến k

Hình 1: Tổ

Xây dựng ýgười dùng tố

Bắt đầu phác giả bắt đ

Thống kê, t

Theo dõi cáa khi SEO c

h.com cho c

rạng

Chương 2

ứu và giải qu

c khi SEO m

ồn tốt thì ch

hỗ trợ cho

ết đúng đắn

ình nghiên c

khi SEO thà

ổng quan q

ý tưởng, lựaối đa.

hát triển weđầu áp dụng

theo dõi các

ác báo cáo chưa thành c

công cụ tìm

2: KHẢO S

uyết vấn đề

một website

húng ta phải

website đ

n, tránh rơi v

cứu được ph

ành công.

quá trình n

a chọn mã n

bsite, song các biện ph

c từ khóa, lư

cụ thể, duy công

m kiếm GOO

ÁT HIỆN

e đã được đ

i biết được

đó.Một web

vào tình trạn

hân thành 0

ghiên cứu v

nguồn, xây

song với vháp để tối ư

ượng người

trì công việ

OGLE

TRẠNG

định hướng

SEO là gì?

bsite được

ng Black H

04 giai đoạn

và giải quy

dựng websi

iệc phát triểưu hóa webs

i truy cập.

ệc hiện tại n

g đúng đắn

?Và các phư

SEO tốt k

at SEO.

n, các giai đ

yết vấn đề

ite có nội du

ển cả về nộite.

nếu SEO thà

Trang:

bằng những

ương pháp

khi và chỉ k

đoạn này đư

ung riêng b

ội dung lẫn

ành công ho

7

g ý

lựa

khi

ược

iệt,

oặc

Page 8: đồ án luận văn tốt nghiệp khoa công nghệ thông tin SEO website dn24h.com lên top google

Tối ưu hóa trang web dn24h.com cho công cụ tìm kiếm GOOGLE Trang:8

Chương 2: Khảo sát hiện trạng

2.1.2. Kế hoạch làm việc

Tuần Công việc

1 - 3 Nghiên cứu về Search Engines, cách thức hoạt động, cách thức thu thập

thông tin.

4 - 6 Nghiên cứu về SEO, các cách giải quyết vấn đề về SEO.

8 - 15 Tối ưu hóa website.

Quảng bá website dựa trên các mạng xã hội.

Phân tích theo dõi bằng các công cụ miễn phí của các Search Engines cung

cấp. Xác định hướng đi đúng đắn cho Website.

16 Theo dõi, điều chỉnh từ khóa, các nội dung không phù hợp

17 Viết báo cáo.

18 Hoàn thành.

2.2. BỐ CỤC

- Chương 1: Tổng quan.

Tại chương này, tác giả sẽ đề cập đến các khái niệm cơ bản về SEO, các hiểu biết ban

đầu về SEO.

Cũng trong chương này, tác giả giới thiệu đề tài luận văn là: “Tìm hiểu và ứng dụng SEO

– Search Engine Optimization vào website DN24h.com” – Một website cộng đồng học tập, trao

đổi kinh nghiệm. Đây là một hướng đi mới khi làm SEO.

Qua chương 1, tác giả giới thiệu toàn cảnh về đề tài.Cách thức nghiên cứu, tiếp cận đề tài

và các mục tiêu đạt được khi hoàn thành tốt luận văn.

- Chương 2: Cơ sở lý thuyết.

Về cơ sở lý thuyết, tác giả tìm hiểu cách thức làm việc chung của các bộ máy tìm kiếm,

các cách thức thu thập thông tin, cách thức để một bộ máy tìm kiếm có thể thấy được trang web.

Trong chương này, tác giả cũng giới thiệu về hai phương thức đánh giá thứ hạng của

website là Alexa và GoogleRank, hai phương thức này đã và đang là thước đo quan trọng trong

việc phát triển trang web.

Cũng trong chương này, tác giả giới thiệu SEO, giúp cho người đọc có cái nhìn rõ ràng

hơn về SEO.

- Chương 3: Ứng dụng.

Sau khi đã tìm hiểu và nắm rõ các phương thức tìm kiếm, các tiêu chí đánh giá xếp hạng

tại Chương 2, tác giả áp dụng những hiểu biết trên cơ sở lý thuyết đó để bắt đầu SEO trang web

DN24h.com.

Page 9: đồ án luận văn tốt nghiệp khoa công nghệ thông tin SEO website dn24h.com lên top google

Tối ưu hóa trang web dn24h.com cho công cụ tìm kiếm GOOGLE Trang:9

Chương 2: Khảo sát hiện trạng

Vì vậy, ở chương này, chúng ta sẽ nghiên cứu các phương pháp cơ bản nhất, chính qui

nhất để có thể tối ưu hóa một website, nhằm đưa website lên các thứ hạng cao khi người dùng

truy vấn.

Sau khi đã áp dụng các phương pháp cơ bản và chính qui, tác giả sẽ thống kê các số liệu

và so sánh lúc chưa áp dụng SEO và sau khi áp dụng SEO.

Một số phương pháp, kĩ năng mềm mà tác giả đã áp dụng để SEO thành công trang web.

- Chương 4: Kết luận – hướng phát triển.

Nội dung của chương 4 sẽ là tổng hợp kết quả các công việc đã làm ở các chương trước.

Các kết quả đã đạt được sau khi hoàn thành luận văn.

Những nhược điểm của SEO.

Hướng phát triển, đề xuất các phương pháp đễ giữ các vị trí cao khi SEO thành công,

cũng như cách thức quảng bá website để có thể thu lợi nhuận, tự nuôi sống website.

Page 10: đồ án luận văn tốt nghiệp khoa công nghệ thông tin SEO website dn24h.com lên top google

Tối ưu hóa trang web dn24h.com cho công cụ tìm kiếm GOOGLE Trang:10

Chương 3: Cơ sở lý thuyết

CHƯƠNG 3:

Page 11: đồ án luận văn tốt nghiệp khoa công nghệ thông tin SEO website dn24h.com lên top google

Tối ư

Chươ

3.1.T3.1.1

thấy

khoá

engin

engin

webs

để đi

đánh

khác

chún

dung

thông

trình

đánh

lượn

ưu hóa trang

ơng 3: Cơ s

TỔNG QUA1. Bộ máy

Search E

những thôn

á, hình ảnh,

ne sẽ phân

ne hoạt độn

Ban đầu

site khi nó đ

i đến các w

h giá các thô

Sau khi n

ng bằng các

g. Ta có thể

Trong đó

Khảo sá

g tin trên w

h để có thể

h giá các thô

Lưu trữ

g lưu trữ vô

g web dn24

ở lý thuyết

AN BỘ MÁtìm kiếm h

Engine hay

ng tin một

địa điểm…

tích yêu cầ

ng theo quy

, SE sẽ gửi

được upload

ebsite khác

ông tin trên

nhận được c

thuật toán

tham khảo

Hình 1: T

ó:

át – Crawl:

website của

tự động the

ông tin trên

ữ - Index: là

ô hạn, các s

h.com cho c

CHƯƠN

ÁY TÌM KIhoạt động n

còn gọi là

cách liên q

… trên search

ầu đó, đánh

trình như sa

các Spider

d lên. Các S

c nhau, sau k

n website đ

các thông ti

riêng biệt đ

cách thức l

Tổng quan

là một giai

bạn. Searc

eo các liên

website đó.

à giai đoạn

search engin

công cụ tìm

NG 3: CƠ S

IẾM như thế nào

công cụ tìm

quan nhất. N

h engine. Kh

h giá, xếp

au :

(hay còn gọ

Spider này đ

khi dừng lạ

đó trước khi

in từ Spider

để trả về các

àm việc chu

cách thức

i đoạn rất q

ch engine c

kết (link) đ

.

search eng

ne có thể ch

m kiếm GOO

SỞ LÝ TH

o ?

m kiếm, bộ

Người dùng

hi nhận đượ

hạng và trả

ọi là con bọ

được lập trìn

ại ở một web

i tự động lầ

r, SE có nhi

c kết quả kh

ung của SE

là, việc của

quan trọng đ

ó những co

để mò đến

gine lưu lại t

hứa hàng tỉ

OGLE

UYẾT

ộ máy tìm k

g có thể tìm

ợc câu lệnh

ả về kết qu

ọ, Crawler) đ

nh để có thể

bsite nào đó

ần theo các

iệm vụ lưu t

hi người dù

tại hình dư

a bộ máy tì

để search en

on bọ (spid

các websit

thông tin sa

kết quả liê

kiếm giúp n

m kiếm thô

yêu cầu tìm

uả liên quan

để tiến hành

ể tự động lầ

ó, Spider nà

liên kết đế

trữ lại trước

ùng truy vấn

ới đây:

m kiếm.

ngine tham

er hay craw

e khác nhau

au khi đã cr

n quan.Một

Trang:

người xem t

ông tin theo

m kiếm, sea

n nhất. Sea

h khảo sát m

ần theo liên

ày sẽ thu th

ến các webs

c khi phân t

n đúng vào

quan, thu th

wler) được

u, thu thập

rawl. Với k

t trang web

11

tìm

o từ

rch

arch

một

kết

hập,

site

tích

nội

hập

lập

khối

Page 12: đồ án luận văn tốt nghiệp khoa công nghệ thông tin SEO website dn24h.com lên top google

Tối ưu hóa trang web dn24h.com cho công cụ tìm kiếm GOOGLE Trang:12

Chương 3: Cơ sở lý thuyết

thể được index nhanh hoặc chậm tuỳ thuộc vào tốc độ crawl, độ trust của website và nhiều yếu tố

khác.

Phân tích – Analysis: giai đoạn này search engine sẽ làm việc trên các dữ liệu mà nó thu

thập được. Sau đó tính toán độ liên quan của dữ liệu so với yêu cầu của người dùng. Các search

engine khác nhau có những thuật toán phân tích khác nhau từ đây tạo ra sự khác biệt giữa các

search engine. Giai đoạn phân tích sẽ tạo tiền đề cho giai đoạn phía sau – Trả về kết quả.

Kết quả - Results: Các kết quả liên quan sẽ được hiển thị trong giai đoạn này. Những kết

quả liên quan thường được sắp ở phía trên, cao hơn những kết quả ít liên quan.Mặc dù không

phải lúc nào các kết quả cũng thoả mãn được yêu cầu của người tìm kiếm.Nhưng cho đến hiện

nay, người dùng khá hài lòng với những gì mà search engine trả về.

Tuy bức tranh hoạt động của search engine bên ngoài nhìn chung khá đơn giản nhưng

bên trong là tập hợp rất nhiều thuật toán phức tạp. Search engine nào thoả mãn nhiều nhất nhu

cầu tìm kiếm người sử dụng sẽ được sử dụng rộng rãi và phát triển mạnh mẽ trong tương lai. Ai

là vua trong thị trường tìm kiếm trực tuyến đầy tiềm năng này?

3.1.2. Giới thiệu về các search engine thông dụng

Hiện nay trên thế giới có rất nhiều search engine đang hoạt động. Trong đó, phải kể đến

ba chàng khổng lồ đang chi phối 98% thị phần tìm kiếmtheo thông kê của SEO MOD tháng

01/2014.

Hình 2: Biểu đồ thị phần search engine từ seomoz.org

Google là search engine được nhiều người sử dụng nhất với 80% số người sử dụng. Tiếp

theo là Yahoo 9.5% và Bing 8.5%, còn lại số phần trăm ít ỏi dành cho các search engine khác.

Hiện nay, ở Việt Nam đa số mọi người cũng sử dụng Google để tìm kiếm thông tin.Nên

việc SEO trên Google là ưu tiên hàng đầu đối với các website.

3.2.CẤU TẠO CHUNG CÁC BỘ MÁY TÌM KIẾM

Bộ máy tìm kiếm thường cấu tạo bởi 3 bộ phận đó là: Bộ thu thập thông tin, Bộ lập chỉ

mục và bộ tìm kiếm thông tin, được hoạt động theo mô hình sau:

Page 13: đồ án luận văn tốt nghiệp khoa công nghệ thông tin SEO website dn24h.com lên top google

Tối ư

Chươ

spide

thập

các d

robot

nhữn

sở dữ

trong

cần m

số lư

đâu c

được

3.2.1

3.2.1.

web

bình

siêu

hoặc

ưu hóa trang

ơng 3: Cơ s

Robot –

er, bot, craw

thông tin từ

danh mục kế

t do thiếu tí

Index –

ng thông tin

ữ liệu nhằm

Search

g một thư v

một danh m

ượng được đ

cũng không

c vị trí của n

1. Robot

Robot đư

1. Robot th

Phân tíc

server, số t

của một tra

Duy trì

liên kết là n

thậm chí b

g web dn24

ở lý thuyết

– bộ thu th

wler, hoặc w

ừ các websi

ết quả của c

ính chủ độn

bộ lập chỉ

n cần thiết (t

m phục vụ ch

Engine – B

viện rất lớn.

mục sách. Tư

đẩy lên càng

g thể duyệt

những từ cần

ược chia làm

hu thập thô

ch – thống

tài liệu trun

ang web,độ

siêu liên k

nó liên kết

ị xóa. Thật

h.com cho c

Hình

hập thông

web worm…

ite trên mạn

công cụ tìm

ng, chúng ch

mục: Các t

thường là c

ho nhu cầu t

Bộ tìm kiế

. Với sức lự

ương tự, tồn

g nhiều hơn

hết. Tuy n

n tìm trong

m 2 loại đó

ông tin có n

kê - Statist

ng bình của

kết dính…

kết – Maint

với những t

không may

công cụ tìm

3: Cấu tạo

tin: Robot

…Về bản ch

ng, nó tự độ

kiếm. Nhữ

hỉ duyệt web

trang web s

các từ đơn, t

tìm kiếm sa

ếm thông t

ực cá nhân

n tại hàng tr

, cho dù ta c

nhiên, với sự

các trang w

là: Robot th

nhiệm vụ

tical Analys

một server,

tenance: M

trang bị hỏn

y vẫn chưa c

m kiếm GOO

o Search En

được biết

hất robot ch

ng duyệt qu

ng trình duy

b khi có sự

sau khi thu t

từ ghép, cụm

au này.

in: Tưởng

ta không th

riệu trang w

có trong tay

ự trợ giúp c

web khắp nơ

hu thập thôn

sis: Robot

, tỉ lệ các dạ

Một trong nh

ng (dead lin

có cơ chế nà

OGLE

ngine

đến dưới n

hỉ là một ch

ua các cấu t

yệt thông th

tác động củ

thập về sẽ đ

m từ quan t

tượng ta m

hể xem qua

web trên thế

y một công

của SE, ta

ơi trên thế g

ng tin, và ro

đầu tiên đư

ạng file khá

hững khó k

nks) khi nhữ

ào cảnh báo

nhiều tên g

hương trình

trúc siêu liê

hường khôn

ủa con ngườ

được phân t

trọng) để lư

muốn tìm v

hết tất cả s

giới và mỗ

cụ lướt web

có thể thậm

giới.

obot chỉ mụ

ược dùng để

ác nhau, kíc

khăn của việ

ững trang n

o các bộ duy

Trang:

gọi khác nh

h duyệt và

n kết và trả

ng được xem

ời.

ích, trích ch

ưu trữ trong

ài quyển sá

sách, vì vậy

ỗi phút trôi q

b tuyệt vời đ

m chí xác đ

c.

đếm số lượ

ch thước tru

ệc duy trì m

này bị thay

y trì về sự th

13

hau:

thu

ả về

m là

họn

g cơ

ách

y ta

qua

đến

ịnh

ợng

ung

một

đổi

hay

Page 14: đồ án luận văn tốt nghiệp khoa công nghệ thông tin SEO website dn24h.com lên top google

Tối ưu hóa trang web dn24h.com cho công cụ tìm kiếm GOOGLE Trang:14

Chương 3: Cơ sở lý thuyết

đổi này. Trên thực tế khi các tác giả nhận ra tài liệu của mình chứa những liên kết hỏng, họ sẽ

thông báo cho nhau, hoặc thỉnh thoảng độc giả thông báo cho họ bằng email. Một số robot có thể

trợ giúp tác giả phát hiện các liên kết hỏng cũng như duy trì các cấu trúc siêu liên kết cùng nội

dung của một trang web. Chức năng này lặp lại liên tục mỗi khi một tài liệu được cập nhật, nhờ

đó mọi vấn đề xảy ra sẽ được giải quyết nhanh chóng.

Ánh xạ địa chỉ web – Mirroring: Mirroring: là một kỹ thuật phổ biến trong việc duy trì

các kho dữ liệu. Một ánh xạ (mirror) sẽ sao chép toàn bộ cấu trúc cây thư mục và thường xuyên

cập nhật những file bị thay đổi. Điều này cho phép nhiều người cùng truy xuất một nguồn dữ

liệu, giảm số liên kết bị thất bại, nhanh hơn và ít chi phí hơn so với truy cập trực tiếp vào site

thực sự chứa các dữ liệu này.

Phát hiện tài nguyên: Có lẽ ứng dụng thú vị nhất của robot là dùng nó để phát hiện tài

nguyên. Con người không thể kiểm soát nổi một khối lượng thông tin khổng lồ trong môi trường

mạng. Robot sẽ giúp thu thập tài liệu, tạo và duy trì cơ sở dữ liệu, phát hiện và xoá bỏ các liên

kết hỏng nếu có, kết hợp với công cụ tìm kiếm cung cấp thông tin cần thiết cho con người.

Kết hợp các công dụng trên - Combined uses: Một robot có thể đảm nhận nhiều chức

năng như: vừa thống kê số lượng tài liệu thu được vừa tạo cơ sở dữ liệu…. Tuy nhiên những ứng

dụng như thế còn khá ít ỏi.

3.2.1.2.Robot chỉ mục – Robot Indexing

Trong quá trình thu thập thông tin phục vụ cho việc lập chỉ mục, ta cần giải quyết vấn đề

sau:

Trong môi trường mạng, robot lấy thông tin từ các site. Vậy robot sẽ bắt đầu từ site nào

?Điều này hoàn toàn phụ thuộc vào robot.Mỗi robot khác nhau có những chiến lược khác

nhau.Thường thì robot sẽ viếng thăm các site phổ biến hoặc những site có nhiều liên kết dẫn đến

nó.

Ai sẽ cung cấp địa chỉ của các site này cho robot ?Có 2 nguồn; Một là Robot nhận các

URL ban đầu từ user.Hai là Robot phân tích các trang web để lấy các URL mới, đến lượt các

URL này trở thành địa chỉ đầu vào cho robot.Quá trình này được lặp lại liên tục.

Chọn dữ liệu nào trong tài liệu để lập chỉ mục? Quyết định chọn dữ liệu nào trong tài liệu

cũng hoàn toàn phụ thuộc vào robot, thường thì những từ được liệt kê như sau được xem là quan

trọng :

- Ở góc cao của tài liệu.

- Trong các đề mục.

- Được in đậm.

- Trong URL.

Page 15: đồ án luận văn tốt nghiệp khoa công nghệ thông tin SEO website dn24h.com lên top google

Tối ưu hóa trang web dn24h.com cho công cụ tìm kiếm GOOGLE Trang:15

Chương 3: Cơ sở lý thuyết

- Trong tiêu đề (quan trọng).

- Trong phần miêu tả trang web (Description) .

- Trong các thẻ dành cho hình ảnh (ALT).

- Trong các thẻ chứa từ khóa.

- Trong các text liên kết.

Một số robot lập chỉ mục trên tiêu đề, hoặc một số đoạn văn bản đầu tiên hoặc toàn bộ

tài liệu (full text). Một số khác lại lập chỉ mục trên các thẻ META(META tags) hoặc các thẻ ẩn,

nhờ vậy tác giả của trang web được quyền ấn định từ khoá cho tài liệu của mình. Tuy nhiên chức

năng này bị lạm dụng quá nhiều do đó các thẻ META không còn giữ được giá trị ban đầu của

chúng nữa (Black Hat SEO).

3.2.2. Index – bộ lập chỉ mục

3.2.2.1.Mô hình xử lý tổng quát của một hệ thống lập chỉ mục

Page 16: đồ án luận văn tốt nghiệp khoa công nghệ thông tin SEO website dn24h.com lên top google

Tối ưu hóa trang web dn24h.com cho công cụ tìm kiếm GOOGLE Trang:16

Chương 3: Cơ sở lý thuyết

Lập chỉ mục là quá trình phân tích và xác định các từ, cụm từ thích hợp cốt lõi có khả

năng đại diện cho nội dung của tài liệu.Như vậy, vấn đề đặt ra là phải rút trích ra những thông tin

chính, có khả năng đại diện cho nội dung của tài liệu.

Thông tin này phải “vừa đủ”, nghĩa là không thiếu để trả ra kết quả đầy đủ so với nhu cầu

tìm kiếm, nhưng cũng phải không dư để giảm chi phí lưu trữ và chi phí tìm kiếm và để loại bỏ

kết quả dư thừa không phù hợp.

Việc rút trích này chính là việc lập chỉ mục trên tài liệu. Trước đây, quá trình này thường

được các chuyên viên đã qua đào tạo thực hiện một cách “thủ công “ nên có độ chính xác cao.

Nhưng trong môi trường hiện đại ngày nay, với lượng thông tin khổng lồ thì việc lập chỉ mục

bằng tay không còn phù hợp, phương pháp lập chỉ mục tự động mang lại hiệu quả cao hơn.

Một thủ tục lập chỉ mục tự động cơ bản:

- Step of tokenization: Tách văn bản ra thành các chuỗi nhờ vào khoảng trắng, mỗi chuỗi xem như là một từ.

- Step of removal of stop words: bỏ những từ thường xuyên xuất hiện trong hầu hết các tài liệu nhưng lại không quan trọng trong các tài liệu như tính từ, đại từ.

- Step of stemming: loại bỏ các hậu tố (Suffixes) để đưa về các từ gốc.

Các từ thu được sẽ được lập chỉ mục. Tuy nhiên hai bước đầu cũng cần cho quá trình lập

chỉ mục cho các tài liệu tiếng Việt, bước thứ ba không cần vì tiếng Việt thuộc dòng ngôn ngữ

đơn thể.

3.2.2.2.Phương pháp lập chỉ mục

Phương pháp lập chỉ mục gồm hai phần chính yếu sau:

Đầu tiên là xác định các mục từ, khái niệm mà có khả năng đại diện cho văn bản sẽ được

lưu trữ (bao gồm cả việc tách từ, loại bỏ stop-word, xử lý hậu tố…)

Thứ hai là xác định trọng số cho từng mục từ, trọng số này là giá trị phản ánh tầm quan

trọng của mục từ đó trong văn bản.

3.2.2.2.1. Xác định mục từ quan trọng cần lập chỉ mục

Mục từ hay còn gọi là mục từ chỉ mục, là đơn vị cơ sở cho quá trình lập chỉ mục. Mục từ

có thể là từ đơn, từ phức hay một tổ hợp từ có nghĩa trong một ngữ cảnh cụ thể. Ta xác định mục

từ của 1 văn bản dựa vào chính nội dung của văn bản đó, hoặc dựa vào tiêu đề hoặc tóm tắt nội

dung của văn bản đó.

Hầu hết việc lập chỉ mục tự động bắt đầu với việc khảo sát tần số xuất hiện của từng loại

từ riêng rẽ trong văn bản. Nếu tất cả các từ xuất hiên trong tập tài liêu với những tần số băng

nhau, thì không thể phân biệt các mục từ theo tiêu chuẩn định lượng. Tuy nhiên, trong văn bản

Page 17: đồ án luận văn tốt nghiệp khoa công nghệ thông tin SEO website dn24h.com lên top google

Tối ưu hóa trang web dn24h.com cho công cụ tìm kiếm GOOGLE Trang:17

Chương 3: Cơ sở lý thuyết

ngôn ngữ tự nhiên, tần số xuất hiện của từ có tính thất thường, do đó những mục từ có thể được

phân biệt bởi tần số xuất hiên của chúng.

3.2.2.2.2. Xác định trọng số cho mục từ

Trọng số của mục từ là sự tần xuất xuất hiện của mục từ trong toàn bộ tài liệu.Phương

pháp thường được sử dụng để đánh giá trọng số của từ là dựa vào thống kê, với ý tưởng là những

từ thường xuyên xuất hiện trong tất cả các tài liệu thì “ít có ý nghĩa hơn” là những từ tập trung

trong một số tài liệu.

Ví dụ: tại trang web DN24h.com thì những mục từ có trọng số cao: từ thiện, đăk nông,

tuổi trẻ…

3.2.3. Search Engine – bộ tìm kiếm thông tin

Vì sao ta cần một công cụ tìm kiếm thông tin? Tưởng tượng ta muốn tìm vài quyển sách

trong một thư viện rất lớn. Với sức lực cá nhân ta không thể xem qua hết tất cả sách, vì vậy ta

cần một danh mục sách. Tương tự, tồn tại hàng triệu trang web trên thế giới và mỗi phút trôi qua

số lượng được đẩy lên càng nhiều hơn, cho dù ta có trong tay một công cụ lướt web tuyệt vời đến

đâu cũng không thể duyệt hết. Tuy nhiên, với sự trợ giúp của SE, ta có thể thậm chí xác định

được vị trí của những từ cần tìm trong các trang web khắp nơi trên thế giới.

3.2.3.1.Các phương thức tìm kiếm:

3.2.3.1.1. Tìm kiếm theo từ khóa

Đây là phương pháp được áp dụng với hầu hết các search engine. Trừ khi tác giả của

trang web xác định từ khóa cho tài liệu của mình, ngược lại điều này phụ thuộc vào search

engine. Như vậy các search engine sẽ tự mình chọn và đánh chỉ mục. Một số site lập chỉ mục cho

tất cả các từ có trong một trang web, một số khác chỉ chọn một số đoạn văn bản.

Các hệ thống đánh chỉ mục trên toàn văn bản (full-text indexing systems) đếm số lần xuất

hiện của mỗi từ trong tài liệu ngoại trừ các từ stopword.Có những công cụ tìm kiếm còn phân

biệt cả chữ hoa lẫn chữ thường.

Những khó khăn khi tìm theo từ khóa: Search engine thường gặp rắc rối với những từ

đồng âm khác nghĩa hoặc những từ có các biến thể khác nhau do có tiền tố và hậu tố. Bên cạnh

đó search engine cũng không thể trả về các tài liệu chứa những từ đồng nghĩa với các từ trong

câu truy vấn.

3.2.3.1.2. Tìm kiếm theo ngữ nghĩa

Không giống các hệ thống tìm theo từ khoá, hệ thống tìm theo ngữ nghĩa sẽ ‘đoán’ ý

muốn của người dùng thông qua câu chữ. Tìm theo ngữ nghĩa hoạt động dựa trên hình thức gom

nhóm tài liệu, phức tạp hơn thì dựa vào ngôn ngữ học, các thuyết về trí tuệ nhân tạo; tiếp cận dựa

Page 18: đồ án luận văn tốt nghiệp khoa công nghệ thông tin SEO website dn24h.com lên top google

Tối ư

Chươ

vào p

hoặc

đề nà

3.2.3

Nhưn

-

-

-

Nếu

hợp.

“diễn

3.3.H

3.3.1

3.3.1

xếp h

chính

của t

G

trắng

ưu hóa trang

ơng 3: Cơ s

phương phá

những cụm

ào đó.

3.1.3. Các

Mọi ngư

ng kết quả c

Do đó đã

Ta khởi

Hoặc ta đ

Hay ta m

Nếu phạ

sau đó ta th

Ví dụ: c

n đàn tuổi tr

HỆ THỐNG

1. Google P

1.1.Google P

Google P

hạng các tra

h với những

Một vài

thông tin trê

Google Pag

g: .

g web dn24

ở lý thuyết

áp tính toán

m từ có nghĩ

Hình

chiến lược

ười đều nhận

cuối cùng th

ã đến lúc ta

đầu với mộ

đã hình dun

muốn tìm địa

ạm vi quan t

hu hẹp phạm

chỉ với từ k

rẻ việt nam”

G RANK

PageRank

PageRank

PageRank l

ang web bằ

g thuật toán

chỉ số quan

ên trang web

eRank đượ

Giá trị của

h.com cho c

n bằng cách

ĩa đặt gần n

h 4: Hệ thố

tìm kiếm

n xét rằng w

hường là lãn

nghĩ đến cá

ột đống thôn

ng được cụ t

a chỉ của ai

tâm của ta q

m vi cần tìm

khóa “diễn đ

”, “diễn đàn

là gì?

à chỉ số đán

ằng cả hai p

xuất sắc.

n trọng quyế

b, độ phổ bi

c chia làm

mỗi trang w

công cụ tìm

h đếm số lần

nhau trong t

ống tự động

web là nơi m

ng phí thời g

ác chiến lượ

ng tin trên m

thể những g

đó ?

quá rộng, ta

m, hãy xem

đàn tuổi trẻ

n tuổi trẻ bế

ng tin cậy ch

phương phá

ết định Goo

iến của tran

10 bậc và

web theo Go

m kiếm GOO

n xuất hiện

tài liệu thì c

g đoán hàn

mà ta luôn c

gian cho nh

ợc tìm kiếm

một chủ đề k

gì cần tìm ?

a nên xem x

m xét việc lự

ẻ” ta có thể

n tre”, “diễn

hỉ giá trị củ

áp tự động v

ogle PageRa

ng web, chất

được biểu

oogle PageR

OGLE

của các từ

cho rằng chú

nh vi tìm ki

ó được thôn

hững URL v

m.

khá rộng ?

xét các thư m

ựa chọn mộ

ể có “diễn đ

n đàn tuổi tr

ủa một trang

và thủ công

ank của mộ

t lượng kỹ t

hiện bằng

Rank tăng d

quan trọng

úng đang ám

ếm

ng tin về bấ

vô ích.

mục web (w

ột công cụ t

đàn tuổi trẻ

rẻ quy nhơn

g web.Goog

g dựa trên h

t trang web

thuật...

vạch màu

dần từ 1 đến

Trang:

g. Khi nhiều

m chỉ một c

ất kỳ chủ đề

web director

tìm kiếm th

ẻ tây nguyê

n”...

gle đánh giá

hơn 100 chỉ

b: độ hữu dụ

xanh trên n

n 10.

18

u từ

chủ

gì.

ry).

hích

ên”,

á và

ỉ số

ụng

nền

Page 19: đồ án luận văn tốt nghiệp khoa công nghệ thông tin SEO website dn24h.com lên top google

Tối ưu hóa trang web dn24h.com cho công cụ tìm kiếm GOOGLE Trang:19

Chương 3: Cơ sở lý thuyết

Thuật ngữ PageRank™ là một thương hiệu được bảo hộ của Google, do Larry Page và

Sergey Brin phát triển tại trường đại học Stanford của Mỹ trong một dự án nghiên cứu về công

cụ tìm kiếm năm 1995.

3.3.1.2.Google PageRank đem lại lợi ích gì ?

Google PageRank hiện nay được coi là chỉ số đáng tin cậy đánh giá mức độ quan trọng

mỗi trang web. Một trang web có chỉ số Google PageRank cao sẽ đem lại ấn tượng đáng tin cậy

cho khách truy cập, điều này đặc biệt có ý nghĩa với các website kinh doanh thương mại điện tử.

Google PageRank ảnh hưởng trực tiếp tới vị trí hiển thị của mỗi trang web khi cạnh tranh

thứ hạng hiển thị trong danh sách kết quả tìm kiếm của Google.Một trang web có PageRank cao

dễ xuất hiện trên đầu danh sách kết quả tìm kiếm của Google hơn.

3.3.1.3.Tăng Google PageRank như thế nào?

Về cơ bản, theo các chuyên gia của Google: "Không được sử dụng các phương pháp giả

tạo, hãy tạo ra các trang web cho mọi người chứ không phải cho các công cụ tìm kiếm".

Tăng thứ hạng trong danh sách kết quả tìm kiếm của Google là phương pháp tăng

PageRank rất hiệu quả vì vừa tăng độ phổ biến các trang web của bạn, vừa tăng lượng khách truy

cập.

Cấu trúc website, cấp bậc cần rõ ràng, nội dung thông tin cần phong phú, hữu ích.

Website không được chứa các liên kết lỗi, các lỗi HTML, lỗi câu lệnh.

Đăng ký website vào các danh bạ uy tín cũng như các website chất lượng khác để tăng độ

phổ biến.

3.3.2. Alexa Rank

3.3.2.1.Alexa Rank là gì ?

Alexa Rank là thước đo mức độ phổ biến của các website. Chỉ số thứ hạng của mỗi

website được Alexa kết hợp đánh giá từ 2 yếu tố là: số trang web người dùng xem (Page Views)

và số người truy cập website (Reach).

3.3.2.2.Alexa Rank mang lại lợi ích gì?

Chỉ số thứ hạng Alexa của một website cao được hiểu là website đó có đông người truy

cập, phần nào đem lại cho website ấn tượng sống động và uy tín.

Trong thị trường quảng cáo trực tuyến, Alexa Rank có thể được sử dụng để đánh giá giá

trị quảng cáo.

Chỉ số Alexa Rank là thước đo ghi nhận thành quả lao động của các webmaster với cộng

đồng và là một công cụ rất hữu ích giúp các webmaster quản trị website hiệu quả.

3.3.2.3.Tăng Alexa Rank như thế nào?

Page 20: đồ án luận văn tốt nghiệp khoa công nghệ thông tin SEO website dn24h.com lên top google

Tối ưu hóa trang web dn24h.com cho công cụ tìm kiếm GOOGLE Trang:20

Chương 3: Cơ sở lý thuyết

Tiến hành các chiến dịch quảng bá website định kỳ nhằm thường xuyên thu hút khách

truy cập website, tăng cao chỉ số Reach.

Hình 5: Minh họa về chỉ số Traffic của Alexa

Trong website, nên có các phần thông tin có giá trị cao, cập nhật để thu hút khách hàng

thường xuyên quay lại website, tăng Page views, Traffic.

Bố trí nội dung, cấu trúc website sao cho thu nhận được thật nhiều cú nhấp chuột của

khách truy cập để tăng Page views nhưng vẫn mang lại cảm giác thoải mái, tiện lợi.

3.4.TÌM HIỂU VỀ SEO

Theo thống kê của tổ chức Verisign, trong Q1 năm 2010 đã có thêm 1 triệu địa chỉ

Internet, nâng tổng số địa chỉ Internet trên thế giới lên trên 193 triệu và số lượng này sẽ không

ngừng tăng lên đồng nghĩa với việc có bằng đó địa chỉ website đã hoặc sẽ hoạt động trên mạng.

Việc thiết kế xong một website cũng giống như việc chọn và mua được vật liệu để xây

nhà từ những cữa hàng vật liệu uy tín mà thôi. Thiết kế một website đẹp là do đội ngũ thiết kế và

xây dựng; còn việc website đó có làm ra tiền hay không thì phần lớn lại phụ thuộc vào cách mà

webmaster quảng cáo và khai thác website đó như thế nào ? Như vậy, câu hỏi được đặt ra là: làm

thế nào để quảng cáo website tới người dùng ?

Có rất nhiều cách để bạn đưa website của mình đến với người dùng như là quảng cáo trên

ti vi, báo chí, quảng cáo tờ rơi, làm hội thảo… Mỗi cá nhân và doanh nghiệp chọn một cách

quảng bá khác nhau. Nhưng một cách vô cùng hiệu quả mà bất kỳ website nào cũng phải làm đó

là tối ưu hóa công cụ tìm kiếm hay còn gọi là SEO. Như vậy:

3.4.1. SEO là gì?

SEO là chữ viết tắt của Search Engine Optimization (tối ưu hóa công cụ tìm kiếm).

SEO là một tập hợp các phương pháp nhằm nâng cao thứ hạng của một website trong các

trang kết quả của các công cụ tìm kiếm và có thể được coi là một tiểu lĩnh vực của tiếp thị qua

công cụ tìm kiếm.

Page 21: đồ án luận văn tốt nghiệp khoa công nghệ thông tin SEO website dn24h.com lên top google

Tối ưu hóa trang web dn24h.com cho công cụ tìm kiếm GOOGLE Trang:21

Chương 3: Cơ sở lý thuyết

Thuật ngữ SEO cũng có thể được dùng để chỉ những người làm công việc tối ưu hóa

công cụ tìm kiếm, là những nhà tư vấn đưa ra những dự án tối ưu hóa cho các website của khách

hàng.

Làm SEO là quá trình tối ưu hóa mã nguồn website, giúp website thân thiện với các công

cụ tìm kiếm để tăng lượng truy cập qua từ khóa tìm kiếm từ đó tăng số lượng người truy cập tới.

Một website được làm SEO tốt, đồng nghĩa với việc website đó luôn xuất hiện ở thứ hạng cao

khi người truy cập sử dụng công cụ tìm kiếm để tìm nội dung mà họ cần. SEO cũng có thể bao

gồm nhiều loại mục tiêu khác nhau khi tìm kiếm như: tìm ảnh, tìm từ khóa, tìm theo quốc gia và

một số loại SEO khác.

Các công cụ tìm kiếm hiển thị một số dạng danh sách trong trang kết quả tìm kiếm

(SERP) bao gồm danh sách trả tiền, danh sách quảng cáo, dánh sách trả tiền theo click và danh

sách tìm kiếm miễn phí.

Mục tiêu của SEO chủ yếu hướng tới việc nâng cao thứ hạng của danh sách tìm kiềm

miễn phí theo một số từ khóa nhằm tăng lượng và chất của khách viếng thăm đến trang.

SEO đôi khi là một dịch vụ độc lập hay là một phần của dự án tiếp thị và có thể rất hiệu

quả ở giai đoạn phát triển ban đầu và giai đoạn thiết kế website. Hiện nay, nhận thức của người

quản trị website tại Việt Nam nói riêng và thế giới nói chung nhận biết việc tối ưu hóa website

để các máy tìm kiếm trỏ tới rất ít. Người sử dụng không ý thức được tầm quan trọng của việc tối

ưu hóa website, hoặc làm các phương thức để các máy tìm kiếm trỏ đến. Hiện trên mạng Internet

có 3 công cụ tìm kiếm hữu hiệu nhất và phổ biến nhất:

- Google

- Yahoo

- Bing

Hiện nay, nhận thức của người quản trị website tại Việt Nam nói riêng và thế giới nói

chung nhận biết việc tối ưu hóa website để các máy tìm kiếm trỏ tới rất ít. Người sử dụng không

ý thức được tầm quan trọng của việc tối ưu hóa website, hoặc làm các phương thức để các máy

tìm kiếm trỏ đến.SEO có thể coi như là một kỹ thuật, một bí quyết thực sự đối với mỗi người

quản trị, xây dựng website hay đơn thuần là người làm trong lĩnh vực truyền thông.

3.4.2. Tại sao cần SEO?

Đại đa số lưu lượng truy cập đến với các website hiện nay đều từ các bộ máy tìm kiếm

lớn như : Google, Yahoo, Bing… Nếu website không được tìm thấy bởi các công cụ tìm kiếm

hoặc nội dung không nằm trong cơ sơ dữ liệu của các bộ máy tìm kiếm thì đó chính là một thảm

họa nếu công ty bạn đang kinh doanh online hoặc có giao dịch trực tuyến hoặc có đi chăng nữa

nhưng kết quả tìm kiếm luôn nằm ở trang 3, 4, 5… trở đi thì cũng coi như là 1 thất bại.

Page 22: đồ án luận văn tốt nghiệp khoa công nghệ thông tin SEO website dn24h.com lên top google

Tối ưu hóa trang web dn24h.com cho công cụ tìm kiếm GOOGLE Trang:22

Chương 3: Cơ sở lý thuyết

Một ví dụ nhỏ: website kinh doanh nội thất và…cứ mỗi “khách hàng tiềm năng” lên

Google, Bing gõ từ khóa tìm kiếm: “đồ nội thất giá rẻ” thì kết quả truy vấn đầu tiên đập vào mắt

họ là website của bạn. Sau đó, khả năng “khách hàng tiềm năng” trở thành ”khách hàng thân

thiết” sẽ cao hơn các đối thủ khác, và dĩ nhiên doanh số tăng theo.

Làm SEO hiện tại với thị trường phát triển mạnh và liên tục như hiện nay là điều mà các

trang web nên làm và phải làm, hãy bắt đầu ngay vì không bao giờ SEO là quá muộn.

Một câu hỏi khác được đặt ra: “Tại sao các công cụ tìm kiếm không thể tìm thấy website

của tôi nếu không có sự trợ giúp của SEO?”

Nếu nói là “không thể tìm thấy” thì không hoàn toàn đúng.

Thực ra, sau 1 thời gian dài, website cũng được các cổng tìm kiếm đưa vào index, nhưng

chỉ là “cho có” chứ không thật sự như những gì mà chúng ta muốn, vì khi các đối thủ cạnh tranh

có sử dụng các biện pháp SEO thì website bạn chẳng bao giờ được lọt vào các trang đầu trên bộ

máy tìm kiếm.

Khi có SEO tham gia vào công việc này, nó sẽ

giúp website bạn tăng thứ hạng trên các công cụ tìm

kiếm và hiển thị nội dung ở những nơi mà người dùng dễ

thấy và tìm kiếm nhất (kết quả hiển thị ngay trang 1).

Thời đại toàn cầu hóa đã biến bất kỳ môi trường

làm việc nào cũng mang tính cạnh tranh, và thế giới ảo

cũng không ngoại lệ.Những website nào đã và đang quan

tâm đến SEO thì đã có 1 lợi thế hơn so với đối thủ của

mình trong việc giành lấy người dùng.

Page 23: đồ án luận văn tốt nghiệp khoa công nghệ thông tin SEO website dn24h.com lên top google

Tối ưu hóa trang web dn24h.com cho công cụ tìm kiếm GOOGLE Trang:23

Chương 4: Ứng dụng

CHƯƠNG 4:

Page 24: đồ án luận văn tốt nghiệp khoa công nghệ thông tin SEO website dn24h.com lên top google

Tối ưu hóa trang web dn24h.com cho công cụ tìm kiếm GOOGLE Trang:24

Chương 4: Ứng dụng

CHƯƠNG 4 - ỨNG DỤNG Ở chương trước, chúng tôi đã trình bày nguyên lý hoạt động, các nguyên lý thu thập

thông tin cũng như Index một trang web lên bộ máy tìm kiếm. Tại chương này, chúng tôi sẽ áp

dụng những nguyên tắc về lý thuyết đó vào trang web Dn24h.com để giúp cho trang web có vị trí

cao khi người dùng truy vấn. Nội dung chương 4 không nêu rõ từng bước xây dựng website mà

chỉ chú trọng về các cách thức cách thức khảo sát người chùng, cách thức chọn tên miền cũng

như các cách để tối ưu hóa nó sao cho việc Index lên các bộ máy tìm kiếm là dễ dàng nhất.

4.1 KHẢO SÁT THÔNG TIN NGƯỜI DÙNG 4.1.1. Thành phần người sử dụng

Đây là bước đầu tiên khi xây dựng một website, tìm hiểu các thành viên cần những gì để

có thể xây dựng một site có thể hỗ trợ tối đa cho họ. Diễn đàn dn24h được tạo nên với mục đích

hướng cho cộng đồng học sinh – sinh viên một sân chơi - một trang web học tập, gắn kết các

thành viên trong địa bàn tỉnh thành 1 khối thống nhất, hướng tuổi trẻ đến cộng đồng qua những

hoạt động từ thiện, các buổi offline, dã ngoại, các kỹ năng trong cuộc sống.

4.1.2 Đối thủ cạnh tranh và hướng đi của Dn24h.com

Đối thủ cạnh tranh của diễn đàn dn24h gồm có những diễn đàn sau:

- Diễn đàn trong tỉnh chưa có diễn đàn nào thực sự lớn mạnh, các nhóm, hội chủ yếu hoạt động qua Mạng xã hội facebook… Các website cạnh tranh đa số là những bộ ban nghành, báo Đăk Nông online…

Do các đối thủ trực tiếp cạnh tranh được hình thành từ rất lâu (8-10 năm), nguồn tin tức,

dữ liệu phong phú. Nên việc lựa chọn một hướng đi đúng đắn và riêng biệt cho DN24H.COM là

một điều quyết định đối với sự phát triển của trang web, do đó hướng phát triển của trang web

phải mang tính riêng biệt, nhắm vào nhu cầu thực tế của người sử dụng:

- Hướng các thành viên tới các hoạt động từ thiện.

- Xây dựng một trang web với các thao tác dễ nhất, hỗ trợ tối đa cho các bạn có kiến thức tin học chưa cao.

- Chia sẻ tài liệu, kiến thức thực tiễn trong cuộc sống.

- Xây dựng một cộng đồng uy tín, thường xuyên tổ chức nhiều hoạt động để các thành viên không cảm thấy nhàm chán khi tham gia diễn đàn.

- Áp dụng Tin học vào thói quen của đa số các bạn trẻ trong địa bàn tỉnh, tìm kiếm những thông tin phong phú, phù hợp với giới trẻ.

4.2 XÂY DỰNG WEBSITE

4.2.1 Chọn tên miền

Là một trong những nhân tố ảnh hưởng đến quá trình phát triển website của bạn trên các

công cụ tìm kiếm việc chọn tên miền cho website theo các tiêu chí sau:

Page 25: đồ án luận văn tốt nghiệp khoa công nghệ thông tin SEO website dn24h.com lên top google

Tối ưu hóa trang web dn24h.com cho công cụ tìm kiếm GOOGLE Trang:25

Chương 4: Ứng dụng

Tiêu chí ngắn gọn và dễ nhớ: Với tên miền dễ nhớ, bạn sẽ có nhiều cơ hội để người sử

dụng trở lại với website hơn những tên miền khó nhớ. Điều này nói lên rằng, không phải tên

miền ngắn là dễ nhớ đối với người sử dụng, mà nó cần phải làm cho người sử dụng có khả năng

nhớ lại website của bạn khi họ cần tìm đến những nội dung mà bạn có khả năng cung cấp.

Hình 1: Minh họa việc chọn Domain

Tiêu chí liên quan đến vấn đề: Việc có được từ khóa chính trong tên miền rất có ý

nghĩa, vì tên miền có ảnh hưởng lớn đến kết quả tìm kiếm trên các công cụ tìm kiếm hiện nay.

Ngoài ra, nó cũng tạo cho người sử dụng dễ nhớ đến tên miền của bạn hơn khi họ muốn tìm

thông tin liên quan đến dịch vụ của bạn.

4.2.2 Chọn Hosting

Hosting là một phần quan trọng để quyết định sự thành công của website.Một website chỉ

phát triển tốt khi được chạy trên một hosting tốt. Việc lựa chọn Hosting sao cho phù hợp được

đánh giá theo các tiêu chí sau:

Tốc độ truy cập: tốc độ nhanh sẽ làm cho người dùng giảm bớt khó chịu khi phải chờ

đợi. Giúp cho họ có cái nhìn tốt về website.

“Tại hội thảo PubCon, Matt Cutts cho biết, Google đang thảo luận nội bộ để đưa

thêm một yếu tố nữa vào hệ thống tìm kiếm của mình giúp xác định thứ hạng các website

trên Google.Yếu tố mới này liên quan đến tốc độ của website và tốc độ tải trang. Matt

Cutts giải thích thêm rằng, đồng sáng lập Google mong muốn rằng tốc độ tìm kiếm trong

tương lai sẽ thực sự nhanh kể cả với các trang báo điện tử. Điều này có nghĩa rằng, các

trang có tốc độ truy cập nhanh chắc chắn sẽ có thứ hạng cao hơn các trang có tốc độ

truy cập chậm. Matt cũng nói thêm rằng, tốc độ tải trang hiện đang là một trong những

yếu tố quyết định tính điểm chất lượng quảng cáo trong hệ thống AdWords, do đó, đây sẽ

là cơ sở để đưa yếu tố này vào hệ thống tìm kiếm của Google trong năm 2010.”

Page 26: đồ án luận văn tốt nghiệp khoa công nghệ thông tin SEO website dn24h.com lên top google

Tối ưu hóa trang web dn24h.com cho công cụ tìm kiếm GOOGLE Trang:26

Chương 4: Ứng dụng

Sử dụng My SQL / Apache / PHP và Linux: Trong hoạt động SEO, bằng cách sử dụng

các máy chủ lưu trữ trên nền Linux là lựa chọn tốt nhất để có thể truy cập vào tất cả các công cụ

cần thiết cho việc SEO.

Sử dụng IP duy nhất: Theo một số chia sẻ của các công ty cung cấp hosting, họ sẽ

không cho phép website có một địa chỉ IP duy nhất. Hầu hết các lần chia sẻ trang web trên web

hosting đều thông qua máy chủ, nơi có nhiều loại nội dung để tạo thu nhập cho máy chủ đó. Vì

vậy tốt nhất nên có được địa chỉ IP duy nhất của chính mình để chánh những phiền phức đó.

Đăng ký theo năm: hầu hết các chuyên gia SEO bất hợp pháp thường chỉ sử dụng các

dịch vụ trong một tháng, vì họ sẽ không thể kéo dài việc này được lâu. Vì vậy nếu trở thành

khánh hàng lâu dài của các công ty cung cấp dịch vụ hosting với hợp đồng hợp lệ, họ sẽ giúp bạn

tránh được các thư rác bất hợp pháp của các SEO khác.

Xác minh kỹ các công ty Hosting: Cách tốt nhất để xác minh các máy chủ lưu trữ là gọi

cho họ theo đường dây điện thoại được cung cấp. Bởi có rất nhiều người gửi thư rác, họ tạo ra

các hosting để người dùng lưu trữ website của mình trên đó nhưng chỉ được 1 tháng và họ sẽ

biến mất với toàn bộ số tiền bạn thanh toán.

Mod-rewrite và htaccess: Mod-rewrite là một module của Apache Web Server, cho

phép viết lại địa chỉ của website. Thông thường, Mod_Rewrite chuyển đổi từ một địa chỉ website

động sang địa chỉ tĩnh. Quy luật chuyển đổi phân tích địa chỉ website được client gởi đến và dịch

sang một địa chỉ mới trước khi thể hiện trên trình duyệt. .htaccess là tên ngầm định của một file

cấu hình chứa các “chỉ dẫn máy chủ” – những dòng lệnh có thể hiểu và biên dịch bởi máy chủ –

nhằm điểu khiển cách thức hoạt động của máy chủ. Các công cụ tìm kiếm như Google chưa phát

triển phương pháp để loại bỏ các nội dung trùng lặp từ các tên miền được và không được bắt đầu

bằng www. Vì vậy một máy chủ lưu trữ có cung cấp Mod-rewrite và htaccess là sự lựa chọn

đúng.

Tìm các Uptime: Uptime là lượng thời gian mà site của hoạt động trong một tháng. Đối

hoạt động SEO, cần đảm bảo cho website được chạy ổn định trong toàn bộ thời gian.Chỉ cần một

chút gián đoạn nhỏ làm ngưng hoạt động của nó cũng sẽ làm ảnh hưởng tới việc SEO, đồng thời

làm giảm thứ hạng website của trên các công cụ tìm kiếm.

4.2.3 Mã nguồn phát triển

Việc lựa chọn một mã nguồn đễ phát triển diễn đàn cũng là một trong những lý do quan

trọng, giúp diễn đàn phát triển biền vững, tác giả ưu tiên chọn mã nguồn vBulletin Board vì

những lý do sau:

Dễ sử dụng, dễ thao tác, và tiết kiệm chi phí, thời gian so với việc phải Code từ đầu.

Page 27: đồ án luận văn tốt nghiệp khoa công nghệ thông tin SEO website dn24h.com lên top google

Tối ưu hóa trang web dn24h.com cho công cụ tìm kiếm GOOGLE Trang:27

Chương 4: Ứng dụng

Tính tương tác cao, thân thiện với người dùng, đa số người sử dụng các diễn đàn trực

tuyến đề đã quá quen thuộc với các giao diện của Xenforo

Tính bảo mật cao, công ty Xenforo luôn cho ra đời những bản vá mới, nhằm hạn chế

những lỗi nhỏ nhất, những công cụ hỗ trợ luôn là tốt nhất.

Luôn cập nhật phiên bản mới, cộng đồng sử dụng Xenforo luôn luôn đông đảo, họ luôn

cho ra đời những công cụ (Mod, Plugin, Addon, Skin) mới nhất, hỗ trợ webmaster tối đa.

4.3 CÁC PHƯƠNG PHÁP TỐI ƯU HÓA WEBSITE

4.3.1 Tối ưu hóa từ khóa (keyword)

Từ khóa là những từ mà những người truy cập nhập vào trong những cỗ máy tìm kiếm

dùng để tìm thấy thông tin từ những website.Điều quan trọng hàng đầu là website có được những

cỗ máy tìm kiếm tốt xếp hạng những từ khóa phổ biến liên quan đến đề tài của Website.

Những từ khóa đúng quan trọng với thành công của những hoạt động SEO của

website.Sẽ không phải là giải pháp tốt khi tối ưu hóa những trang web cho những từ khóa mà

không ai sử dụng trong những cỗ máy tìm kiếm. Hơn nữa, để có những khách hàng mục tiêu,

những từ khóa không được rộng quá hoặc chung quá.

Việc xác định đúng từ khóa hợp lý sẽ góp phần thành công cho chiến dịch quảng bá trên

cỗ máy chủ tìm kiếm.

Lựa chọn từ khóa có liên quan trực tiếp đến những nội dung mà site sẽ đưa ra.

Dùng công cụ có sẵn để phân tích từ khóa, từ đó lựa chọn một từ khóa thích hợp.

Khi khảo sát đặt từ khóa, tác giả đã đóng vai người sử dụng Internet, lên mạng vào học

tập, những từ khóa hay sử dụng nhất là “Tỉnh đăk nông”, “du lịch đăk nông”, “tin đăk nông”…

Cũng qua khảo sát trên 30 thành viên của CLB Vòng Tay Nhân Ái Đăk Nông thuộc hội liên hiệp

thanh niên tỉnh Đăk Nông thì số lượng người sử dụng các từ khóa trên rất nhiều. Theo tiêu chí

của diễn đàn dn24h.com, phong cách sử dụng từ khóa của người sử dụng, tác giả đã quyết định

chọn từ khóa Đăk Nông (dak nong) như là một từ khóa chính thức để SEO trang web Dn2h.com.

ngoài ra những từ khóa rất quan trọng như là “diễn đàn đăk nông”, “tin tức đăk nông”, “từ thiện

đăk nông”….

4.3.2 Tiêu đề: chính xác và duy nhất.

Khi chúng ta truy cập một trang web nào đó, ta thấy một tiêu đề hiển thị trên thanh tiêu đề màu xanh của trình duyệt web. Ví dụ, nếu bạn truy cập vào trang web của khoa Kỹ Thuật Công Nghệ – trường Đại học Văn Hiến, bạn sẽ thấy tiêu đề của nó là "Khoa KỸ THUẬT CÔNG NGHỆ | KỸ THUẬT CÔNG NGHỆ | Đại học Văn Hiến". Vậy để có tiêu đề này bạn cần làm gì ? Cách đơn giản đó là đưa tiêu đề này vào thẻ TITLE của trang web. Công việc này được thực hiện bởi lập trình viên hoặc người thực hiện SEO.

Page 28: đồ án luận văn tốt nghiệp khoa công nghệ thông tin SEO website dn24h.com lên top google

Tối ưu hóa trang web dn24h.com cho công cụ tìm kiếm GOOGLE Trang:28

Chương 4: Ứng dụng

Hình 2: Đặt tiêu đề: Diễn Đàn Tuổi Trẻ TỈNH ĐĂK NÔNG | TỪ THIỆN

Hình 3: Tiêu đề trang chủ có thể liệt kê tên của website, một số thông tin quan trọng, có thể một vài lĩnh vực hoạt động của site đó.

Hình 4: Tiêu đề của trang xuất hiện vị trí trên cùng của trình duyệt

Page 29: đồ án luận văn tốt nghiệp khoa công nghệ thông tin SEO website dn24h.com lên top google

Tối ưu hóa trang web dn24h.com cho công cụ tìm kiếm GOOGLE Trang:29

Chương 4: Ứng dụng

Hình 5: Truy vấn Google

Nếu tài liệu xuất hiện trong trang “kết quả tìm kiếm” nội dung của thẻ <title> thường sẽ

xuất hiện tại dòng đầu tiên của các kết quả. Các dòng này được in đậm nếu chúng xuất hiện trong

“truy vấn tìm kiếm” của người dùng.Điều này sẽ giúp người dùng nhận ra nếu trang web liên

quan đến kết quả tìm kiếm của họ.

Đề xuất biện pháp tốt nhất cho <TITLE>:

- Chọn tiêu đề truyền đạt hiệu quả chủ đề nội dung trang: mỗi trang web phải có một tiêu đề khác nhau phù hợp với nội dung của trang web đó. Ví dụ tiêu đề "Diễn đàn tuổi trẻ đăk nông" sẽ đề cập đến vấn đề tuổi trẻ Đăk Nông trong trang web như thế nào chứ không bàn đến việc nội dung của diễn đàn. Vì vậy, nếu trang web của bạn luôn có tiêu đề "Chào mừng bạn đến với website của....." thì hãy xem xét lại ngay cách đặt tiêu đề.

- Tạo tiêu đề duy nhất cho mỗi trang: mỗi trang nên có thẻ tiêu đề duy nhất, thẻ này giúp Google biết trang này không giống như trang khác nên trang web của bạn ở điểm nào.

- Sử dụng các tiêu đề ngắn gọn nhưng mang tính mô tả: Tiêu đề có thể vừa ngắn gọn và giàu thông tin. Nếu tiêu đề quá dài, Google sẽ chỉ hiển thị một phần tiêu đề trong kết quả tìm kiếm.

- Không nhất thiết phải có từ khóa trong tiêu đề webiste, tuy nhiên việc cố gắng tạo được từ khóa trong tiêu đề trang web sẽ mang lại hiệu quả cao hơn trong kết quả tìm kiếm của các công cụ tìm kiếm. Tuy nhiên, không phải bạn có vị trí cao sẽ được khách hàng lựa chọn nhiều hơn nhưng bạn phải có mặt trong danh sách 10 kết quả tìm kiếm đầu tiên. Hãy đặt mình vào vị trí của người tìm kiếm thông tin, sau khi nhập vào từ khóa tìm kiếm bạn sẽ nhận được 10 kết quả tìm kiếm đầu tiên. Đến lúc này, bạn sẽ đọc các tiêu đề hiển thị trên kết quả tìm kiếm trước khi bấm vào liên kết để đến trang web có nội dung cần tìm. Vì vậy, bạn cần phải có một tiêu đề hấp dẫn nữa mới thu hút được số lượng khách viếng thăm khi bạn đã có mặt ở trang đầu tiên của kết quả tìm kiếm.

Page 30: đồ án luận văn tốt nghiệp khoa công nghệ thông tin SEO website dn24h.com lên top google

Tối ưu hóa trang web dn24h.com cho công cụ tìm kiếm GOOGLE Trang:30

Chương 4: Ứng dụng

- Tiêu đề hấp dẫn người đọc: tiêu đề trang web của bạn hấp dẫn sẽ thu hút được nhiều người quan tâm hơn mặc dù bạn có thứ hạng thấp hơn. Vì vậy ngoài việc có từ khóa trong tiêu đề bạn cần phải tạo ra được tiêu đề hấp dẫn với người sử dụng.

Tránh:

- Chọn tiêu đề không liên quan đến trang.

- Sử dụng các tiêu đề mặc đinh như: Untitle Document hoặc New Page…(mặc định của các công cụ thiết kế web)

- Sử dụng tiêu đề chung cho toàn bộ trang hoặc một nhóm lớn các trang.

- Sử dụng các tiêu đề quá dài, không có ích cho người dùng.

- Bổ sung các từ khóa không cần thiết trong các thẻ tiêu đề, việc đặt từ khóa chung với tiêu đề là tốt, nhưng việc này lại là con dao hai lưỡi. Vì vậy, bạn nên suy nghĩ kĩ trước khi bổ sung các từ khóa mới vào tiêu đề trang web của mình.

4.3.3 Meta Description

Thẻ Meta Description của trang cung cấp cho Google và các công cụ tìm kiếm khác một

bản tóm tắt nội dung trang. Trong khi <title> chỉ là một hoặc cụm từ thì Meta Description có thể

là một câu hoặc hai câu hoặc một đoạn ngắn.

Hiện nay Google đã cung cấp cho các người quản trị một ứng dụng để phân tích nội dung

để ta có thể biết về bất kì thẻ Meta Description nào quá ngắn hoặc quá dài hoặc trùng lặp quá

nhiều lần.

Hình 6: Phân tích Phân Tích Các Description

Page 31: đồ án luận văn tốt nghiệp khoa công nghệ thông tin SEO website dn24h.com lên top google

Tối ưu hóa trang web dn24h.com cho công cụ tìm kiếm GOOGLE Trang:31

Chương 4: Ứng dụng

Hình 7: Giống như thẻ <title> thẻ <meta description> cũng được đặt ở thẻ <head>

Meta Description là rất quan trọng bởi vì google “có thể” sử dụng chúng làm các đoạn

trích cho trang web của bạn.

Hình 8: Truy vấn: “Nhân Ái Đăk Nông”

Page 32: đồ án luận văn tốt nghiệp khoa công nghệ thông tin SEO website dn24h.com lên top google

Tối ưu hóa trang web dn24h.com cho công cụ tìm kiếm GOOGLE Trang:32

Chương 4: Ứng dụng

Thử một truy vấn khác: “Nhân Ái Đăk Nông”; các từ trong đoạn trích được im đậm khi

chúng xuất hiện trong truy vấn của người dùng. Điều này giúp người dùng biết liệu nội dung trên

trang có khớp với những gì mà người đó đang tìm kiếm hay không?

Đề xuất biện pháp tốt nhất cho Meta Description:

- Tóm tắt chính xác nội dung trang, mô tả phải vừa cung cấp thông tin, vừa thu hút người dùng nếu họ nhìn thấy thẻ Meta Description của dưới dạng đoạn trích trong Kết Quả Tìm Kiếm.

- Sử dụng các Meta Description duy nhất cho mỗi trang: Mỗi trang có thể có một thẻ Meta Description khác nhau giúp cả người dùng và Google, đặc biệt là trong các tìm kiếm mà người dùng có thể đưa lên nhiều trang trên tiên miền. Nếu trang web có hàng nghìn hoặc hàng triệu trang, các Meta Description được tạo thủ công thì cũng không khả thi. Trường hợp này có thể tạo tự động các thẻ mta dựa trên nội dung của mỗi trang.

Tránh:

- Viết thẻ Meta Description không liên quan đến nội dung trang.

- Sử dụng các Description chung chung như “This Is A Web” hoặc “Website About…”

- Chỉ điền các keyword vào Meta Description, điều này rất lãng phí.

- Sao chép toàn bộ nội dung của tài liệu vào thẻ Meta Description.

- Sử dụng thẻ Meta Description cho tất cả các trang hoặc số lượng trang lớn.

4.3.4 Cải tiến cấu trúc URL

Việc tạo các danh mục và tên tệp cho các tài liệu trên trang web của bạn không chỉ có thể

giúp bạn giữ cho trang web được sắp xếp tốt hơn mà còn dẫn đến việc thu thập dữ liệu các tài

liệu của bạn tốt hơn bằng các công cụ tìm kiếm. Nó cũng có thể tạo ra các URL dễ dàng hơn,

"thân thiện hơn" cho những người muốn liên kết tới nội dung của bạn.

Khách truy cập có thể bị bối rối trước các URL cực kỳ dài và khó hiểu chỉ chứa rất ít từ

có thể nhận ra.

Page 33: đồ án luận văn tốt nghiệp khoa công nghệ thông tin SEO website dn24h.com lên top google

Tối ưu hóa trang web dn24h.com cho công cụ tìm kiếm GOOGLE Trang:33

Chương 4: Ứng dụng

Hình 9: URL đơn giản

URL đến tài liệu được hiển thị dưới dạng một phần của kết quả tìm kiếm trong Google,

bên dưới tiêu đề và đoạn trích của tài liệu.Giống như tiêu đề và đoạn trích, các từ trong URL

trong kết quả tìm kiếm được in đậm nếu chúng xuất hiện trong truy vấn của người dùng.

Đề xuất biện pháp tốt nhất cho URL:

- Sử dụng các từ trong URL - URL chứa các từ liên quan đến nội dung và cấu trúc trang web của bạn sẽ thân thiện với khách truy cập hơn khi điều hướng trang web của bạn. Khách truy cập sẽ nhớ chúng tốt hơn và có thể sẵn sàng liên kết đến chúng hơn.

- Tạo cấu trúc thư mục đơn giản: Sử dụng cấu trúc thư mục tổ chức tốt nội dung của bạn và giúp khách truy cập dễ dàng biết vị trí của họ trên trang web của bạn. Thử sử dụng cấu trúc thư mục của bạn để chỉ định loại nội dung được tìm thấy tại URL đó.

- Cung cấp phiên bản URL để liên kết đến tài liệu: Để ngăn người dùng liên kết tới phiên bản URL và ngăn những người khác liên kết tới phiên bản khác (điều này có thể chia cắt uy tín của nội dung đó giữa các URL), tập trung vào việc sử dụng và tham chiếu tới URL trong cấu trúc và liên kết bên trong trên trang của bạn. Nếu bạn phát hiện rằng mọi người đang truy cập cùng một nội dung thông qua nhiều URL, việc thiết lập 301 chuyển hướng từ các URL không ưa thích đến URL vượt trội là giải pháp tốt cho vấn đề này.

Tránh:

- Sử dụng các URL dài dòng với các tham số và các ID phiên không cần thiết

- Chọn tên trang chung chung như "trang1.html"

- Sử dụng quá nhiều từ khoá như "hocguitar-hocguitaronline-diendanguitar.php"

- Có cấu trúc lớp thư mục con sâu như".../dir2 /dir3/dir4/dir5/dir6/page.php"

- Sử dụng tên thư mục không liên quan đến nội dung trong thư mục đó

Page 34: đồ án luận văn tốt nghiệp khoa công nghệ thông tin SEO website dn24h.com lên top google

Tối ưu hóa trang web dn24h.com cho công cụ tìm kiếm GOOGLE Trang:34

Chương 4: Ứng dụng

- Có các trang từ các subdomain và thư mục gốc (ví dụ: "dn24h.com/index.php" và "forum.dn24h.com/index.php") truy cập cùng một nội dung.

- Lẫn lộn các phiên bản URL có www. và không có www. trong cấu trúc liên kết bên trong của bạn

- Sử dụng cách viết hoa URL kỳ quặc (nhiều người dùng mong đợi các URL được viết thường và nhớ chúng tốt hơn.)

4.3.5 Điều hướng

Điều hướng trang web rất quan trọng trong việc giúp khách truy cập nhanh chóng tìm

thấy nội dung mà họ muốn. Điều này cũng có thể giúp các công cụ tìm kiếm hiểu nội dung mà

người quản trị web cho là quan trọng. Mặc dù các kết quả tìm kiếm của Google được cung cấp ở

cấp độ trang, Google cũng muốn biết trang đóng vai trò gì trong bức tranh lớn hơn của trang

web.

Hình 10: Điều hướng Breadcrumb

Tất cả các trang web đều có trang chủ hoặc trang "gốc", trang này thường là trang có tần

suất truy cập nhiều nhất trên trang web và là nơi bắt đầu để điều hướng cho nhiều khách truy

cập.

Đề xuất biện pháp tốt nhất để điều hướng:

- Tạo cấu trúc phân tầng trôi chảy một cách tự nhiên:Làm cho người dùng đi từ nội dung tổng quát đến nội dung cụ thể hơn mà họ muốn trên trang web của bạn càng dễ dàng càng tốt. Thêm các trang điều hướng khi hợp lý và hoạt động hiệu quả các trang này để đưa chúng vào cấu trúc liên kết bên trong của bạn.

Hình 11: Điều hướng cho một số mục quan trọng

Page 35: đồ án luận văn tốt nghiệp khoa công nghệ thông tin SEO website dn24h.com lên top google

Tối ưu hóa trang web dn24h.com cho công cụ tìm kiếm GOOGLE Trang:35

Chương 4: Ứng dụng

Sử dụng hầu hết văn bản để điều hướng, Kiểm soát hầu hết điều hướng từ trang này sang

trang khác trên trang web thông qua các liên kết văn bản làm cho các công cụ tìm kiếm dễ dàng

thu thập dữ liệu và hiểu trang web hơn. Nhiều người dùng cũng ưa thích cách này hơn các cách

khác, đặc biệt trên một số thiết bị có thể không thể xử lý Flash hay JavaScript.

Sử dụng điều hướng kiểu "Breadcrumb": Breadcrumb là một hàng các liên kết bên trong

ở đầu hoặc cuối trang cho phép khách truy cập nhanh chóng điều hướng trở lại phần trước hoặc

trang gốc. Nhiều Breadcrumb có trang tổng quát nhất (thường là trang gốc) là phần thứ nhất, bên

trái là hầu hết liên kết và liệt kê các phần cụ thể hơn ở bên phải.

Đặt trang sơ đồ trang web HTML trên trang web và sử dụng tệp Sơ đồ trang web XML.

Trang sơ đồ trang web đơn giản cùng với các liên kết đến tất cả các trang hoặc các trang

quan trọng nhất (nếu site có hàng trăm hoặc hàng nghìn) trên trang web có thể hữu ích.Tạo tệp

Sơ đồ trang web XML cho trang web giúp đảm bảo cho các công cụ tìm kiếm khám phá các

trang trên trang web.

Xem xét điều sẽ xảy ra khi người dùng xoá một phần URL?Một số người dùng có thể

điều hướng trang web một cách kỳ quặc và bạn nên dự đoán điều này.

Có trang 404 hữu ích: Người dùng đôi khi sẽ đi tới trang không tồn tại trên trang web,

bằng cách truy cập liên kết hỏng hoặc nhập URL sai. Có trang 404 tuỳ chỉnh hướng dẫn tận tình

người dùng quay trở lại trang đang hoạt động trên trang web có thể nâng cao đáng kể trải nghiệm

của người dùng. Trang 404 có lẽ nên có liên kết quay lại trang gốc và cũng có thể cung cấp các

liên kết đến nội dung phổ biến hoặc có liên quan trên trang web.

Hình 12: Trang 404 sẽ từ động chuyển về trang chủ khi liên kết không đúng

Page 36: đồ án luận văn tốt nghiệp khoa công nghệ thông tin SEO website dn24h.com lên top google

Tối ưu hóa trang web dn24h.com cho công cụ tìm kiếm GOOGLE Trang:36

Chương 4: Ứng dụng

Tránh:

- Tạo mạng lưới liên kết điều hướng phức tạp, ví dụ: liên kết mọi trang trên trang web của bạn đến mọi trang khác.

- Chia cắt nội dung.

- Làm cho trang sơ đồ trang web HTML trở nên lỗi thời với các liên kết hỏng.

- Tạo sơ đồ trang web HTML chỉ liệt kê các trang mà không sắp xếp trang.

- Cho phép các trang 404 được lập chỉ mục trong các công cụ tìm kiếm.

- Chỉ cung cấp thông báo mơ hồ như "Không tìm thấy", "404" hoặc không có trang 404 nào.

4.3.6 Cung cấp nội dung và dịch vụ chất lượng

Việc tạo nội dung hấp dẫn và hữu ích dường như sẽ ảnh hưởng đến trang web nhiều hơn

bất kỳ nhân tố nào khác.

Hình 13: Sắp xếp các thư mục Category cực kì khoa học – giúp cho người dùng dễ dàng tìm kiếm.

Người dùng biết đến nội dung tốt khi họ nhìn thấy nó và dường như sẽ muốn chuyển

hướng người dùng khác đến nó.Điều này có thể thực hiện qua các bài đăng blog, các dịch vụ

phương tiện truyền thông xã hội, email, diễn đàn hoặc các cách khác.

Page 37: đồ án luận văn tốt nghiệp khoa công nghệ thông tin SEO website dn24h.com lên top google

Tối ưu hóa trang web dn24h.com cho công cụ tìm kiếm GOOGLE Trang:37

Chương 4: Ứng dụng

Hình 14: Thống kê các bài viết mới nhất.

Thông tin được truyền miệng hoặc truyền có hệ thống sẽ giúp bạn xây dựng uy tín cho

trang web của mình với cả người dùng và Google và hiếm khi nó không đi kèm với nội dung

chất lượng.

Đề xuất biện pháp tốt cho nội dung

- Viết văn bản dễ đọc: Người dùng thích nội dung được viết rõ ràng và dễ theo dõi.

- Tổ chức tốt chủ đề: Tổ chức nội dung của bạn sao cho khách truy cập biết rõ nơi chủ đề này bắt đầu và nơi chủ đề khác kết thúc luôn luôn hữu ích. Chia nội dung của bạn thành các bó và đoạn lôgic giúp người dùng tìm thấy nội dung mà họ muốn nhanh hơn.

- Sử dụng ngôn ngữ phù hợp: Hãy nghĩ về các từ mà người dùng có thể tìm kiếm để tìm một đoạn nội dung của bạn. Người dùng nào biết nhiều về chủ đề có thể sử dụng nhiều từ khoá khác nhau trong truy vấn tìm kiếm của mình hơn người mới tìm hiểu chủ đề.

- Tạo nội dung mới mẻ, duy nhất: Nội dung mới sẽ không chỉ giữ cho khách truy cập đã có của bạn trở lại mà còn mang lại các khách truy cập mới.

- Cung cấp nội dung hoặc dịch vụ duy nhất: Hãy xem xét việc tạo ra dịch vụ mới, hữu ích mà không trang web nào khác cung cấp. Bạn cũng có thể viết bài nghiên cứu độc đáo, đăng mẩu tin tức thú vị hoặc tăng số lượng người dùng duy nhất của mình. Các trang web khác có thể thiếu tài nguyên hoặc chuyên môn để làm những điều này.

- Tạo nội dung chủ yếu dành cho người dùng của bạn, không phải dành cho công cụ tìm kiếm - Thiết kế trang web của bạn theo nhu cầu của khách truy cập mà vẫn đảm bảo trang web của mình dễ truy cập với công cụ tìm kiếm thường tạo ra các kết quả khả quan.

4.3.7 Chuỗi kí tự liên kết

Chuỗi ký tự liên kết là văn bản có thể nhấp được mà người dùng sẽ nhìn thấy dưới dạng

kết quả của liên kết và được đặt trong thẻ liên kết <a href>

Page 38: đồ án luận văn tốt nghiệp khoa công nghệ thông tin SEO website dn24h.com lên top google

Tối ưu hóa trang web dn24h.com cho công cụ tìm kiếm GOOGLE Trang:38

Chương 4: Ứng dụng

Hình 15: Chuỗi kí tự liên kết được lấy trực tiếp từ title

Chuỗi ký tự này cho người dùng và Google biết một vài điều về trang web đang liên kết

đến. Các liên kết có thể là liên kết bên trong trỏ đến các trang khác trên trang web hoặc liên kết

bên ngoài dẫn đến nội dung trên các trang web khác. Trong cả hai trường hợp này, chuỗi ký tự

liên kết của bạn càng tốt thì người dùng càng dễ điều hướng và Google càng dễ hiểu trang mà

bạn đang liên kết đến có nội dung gì.

Đề xuất biện pháp tốt nhất cho chuỗi kí tự liên kết:

- Chọn văn bản mô tả: chuỗi ký tự liên kết sử dụng cho liên kết nên cung cấp ít nhất một ý tưởng cơ bản về nội dung mà trang được liên kết nói đến.

- Sử dụng URL của trang làm chuỗi ký tự liên kết trong hầu hết các trường hợp.

- Viết chuỗi ký tự súc tích: hướng đến chuỗi ký tự ngắn gọn nhưng có tính mô tảthường là một vài từ hoặc cụm từ ngắn.

- Định dạng các liên kết để dễ nhận ra chúng. Giúp người dùng dễ dàng phân biệt giữa văn bản thông thường và chuỗi ký tự liên kết trong các liên kết của bạn. Nội dung của bạn trở nên kém hữu ích nếu người dùng bỏ qua liên kết hoặc vô tình nhấp vào chúng.

- Nghĩ về chuỗi ký tự liên kết cho cả các liên kết bên trong. Bạn có thể thường nghĩ về liên kết theo hướng trỏ đến các trang web bên ngoài nhưng việc chú ý hơn vào chuỗi ký tự sử dụng cho các liên kết bên trong có thể giúp người dùng và Google điều hướng trang web tốt hơn.

Tránh:

- Viết chuỗi ký tự liên kết chung chung giống như "trang", 'bài viết", hoặc "nhấp vào đây".

- Sử dụng chuỗi ký tự nằm ngoài chủ đề hoặc không liên quan đến nội dung của trang được liên kết đến.

- Viết chuỗi ký tự liên kết dài, chẳng hạn như một câu dài hoặc một đoạn văn bản ngắn.

- Sử dụng CSS hoặc kiểu văn bản khiến cho các liên kết trông đúng như văn bản thông thường.

- Sử dụng chuỗi ký tự liên kết có quá nhiều từ khoá hoặc quá dài chỉ dùng cho các công cụ tìm kiếm.

Page 39: đồ án luận văn tốt nghiệp khoa công nghệ thông tin SEO website dn24h.com lên top google

Tối ưu hóa trang web dn24h.com cho công cụ tìm kiếm GOOGLE Trang:39

Chương 4: Ứng dụng

- Tạo các liên kết không cần thiết không giúp được người dùng điều hướng trang Web.

4.3.8 Tiêu đề cho nội dung

Thẻ tiêu đề được sử dụng để trình bày cấu trúc trang đến người dùng.Có sáu kích thước

của thẻ tiêu đề, bắt đầu là <h1>, quan trọng nhất và kết thúc là <h6>, ít quan trọng nhất.

Hình 16: Tiêu Đề bài viết được in đậm và đặt ngay ở đầu bài viết (tự động)

Thông thường, các thẻ tiêu đề khiến cho phần văn bản được chứa trong chúng lớn hơn

phần văn bản bình thường trên trang, đây là dấu hiệu trực quan cho người dùng biết rằng phần

văn bản này quan trọng và có thể giúp họ hiểu mức độ nào đó về loại nội dung bên dưới phần

tiêu đề. Nhiều kích thước tiêu đề được sử dụng để tạo ra cấu trúc phân cấp cho nội dung, giúp

người dùng dễ dàng điều hướng xuyên suốt tài liệu.

Đề xuất biện pháp tốt nhất cho Tiêu Đề:

- Nghĩ về điểm chính và điểm phụ của nội dung trên trang và quyết định nơi sử dụng các thẻ tiêu đề một cách thích hợp.

Page 40: đồ án luận văn tốt nghiệp khoa công nghệ thông tin SEO website dn24h.com lên top google

Tối ưu hóa trang web dn24h.com cho công cụ tìm kiếm GOOGLE Trang:40

Chương 4: Ứng dụng

- Sử dụng thẻ tiêu đề ở nơi chúng có ý nghĩa. Quá nhiều thẻ tiêu đề trên trang có thể khiến người dùng khó khăn khi xem lướt nội dung và xác định đâu là nơi chủ đề kết thúc và chủ đề khác bắt đầu.

Tránh:

- Đặt phần văn bản trong các thẻ tiêu đề không giúp ích cho việc xác định cấu trúc trang.

- Sử dụng thẻ tiêu đề tại nơi các thẻ khác như <em> và <strong> có thể thích hợp hơn.

- Chuyển từ kích thước thẻ tiêu đề này thành kích thước thẻ tiêu đề khác một cách tuỳ tiện.

- Sử dụng quá nhiều thẻ tiêu đề xuyên suốt trang.

- Đặt tất cả phần văn bản của trang vào thẻ tiêu đề.

- Chỉ sử dụng thẻ tiêu đề để tạo kiểu cho văn bản chứ không trình bày cấu trúc.

4.3.9 Tối Ưu Hóa Hình Ảnh.

Hình ảnh có vẻ là thành phần rõ ràng của trang web,có thể tối ưu hoá việc sử dụng hình

ảnh. Tất cả các hình ảnh có thể có tên tệp riêng biệt và thuộc tính "alt".

Hình 17: Thuộc tính "alt" cho phép chỉ định văn bản thay thế cho hình ảnh nếu hình ảnh đó không thể hiển thị vì một số lý do.

Page 41: đồ án luận văn tốt nghiệp khoa công nghệ thông tin SEO website dn24h.com lên top google

Tối ưu hóa trang web dn24h.com cho công cụ tìm kiếm GOOGLE Trang:41

Chương 4: Ứng dụng

Tại sao lại sử dụng thuộc tính này? Nếu người dùng đang xem trang web trên trình duyệt

không hỗ trợ hình ảnh, hoặc đang sử dụng các công nghệ thay thế, như trình đọc màn hình, các

nội dung trong thuộc tính thay thế sẽ cung cấp thông tin về hình ảnh.

Một lý do khác là nếu sử dụng hình ảnh làm liên kết, văn bản thay thế cho hình ảnh đó sẽ

được xử lý tương tự như chuỗi ký tự liên kết của liên kết văn bản.

Hình 18: Hình ảnh được lưu trữ tại Image Folder (quản lý bằng FlashFXP)

Tuy nhiên, Không nên sử dụng quá nhiều hình ảnh cho các liên kết trong điều hướng

trang web khi các liên kết văn bản có thể phục vụ cho cùng một mục đích. Cuối cùng, việc tối ưu

hoá các tên tệp hình ảnh và văn bản thay thế giúp các dự án tìm kiếm hình ảnh như Tìm kiếm

Hình ảnh của Google dễ dàng hiểu các hình ảnh hơn.

Đề xuất biện pháp tốt nhất cho hình ảnh:

- Sử dụng các tên tệp và văn bản thay thế ngắn gọn nhưng có tính mô tả.

- Cung cấp văn bản thay thế khi sử dụng hình ảnh làm liên kết.

- Lưu trữ hình ảnh trong thư mục của chính chúng.

- Sử dụng các loại tệp thường được hỗ trợ - Hầu hết các trình duyệt đều hỗ trợ các định dạng hình ảnh JPEG, GIF, PNG và BMP.

4.3.10 Robot

Page 42: đồ án luận văn tốt nghiệp khoa công nghệ thông tin SEO website dn24h.com lên top google

Tối ưu hóa trang web dn24h.com cho công cụ tìm kiếm GOOGLE Trang:42

Chương 4: Ứng dụng

Tệp "robots.txt" cho các công cụ tìm kiếm biết liệu chúng có thể truy cập và nhờ vậy, thu

thập dữ liệu các phần trong trang web không. Tệp này phải được đặt tên là "robots.txt" và được

đặt trong thư mục gốc của trang web. Thực chất, file robots.txt là một tập tin văn bản đơn giản

(không chứa mã HTML) được đặt trong thư mục gốc của web site

Robots hoạt động như thế nào?robots.txt hoạt động bằng cách xác định một user-agent và

một command cho user-agent này.

Hình 19: Robots.txt được đặt ở root

Các tham số có trong file robots.txt

- User-agent: khai báo tên search engine mà bạn muốn thiết lập khu vực truy cập với nó, vd: Googlebot, Yahoo! Slurp

- Disallow: là khu vực mà bạn muốn khoanh vùng không cho phép search engine truy cập.

- Crawl-Delay: thông số này xác định thời gian (tính bằng giây) search phải đợi trước khi chuyển sang site tiếp theo. Điều này sẽ có ích để ngăn chặn các search engine load server tùy tiện.

- Dấu # được sử dụng trước các dòng cần comment.

4.4 CHIẾN DỊCH QUẢNG BÁ WEBSITE

4.4.1 Cập nhật nội dung

Bằng cách tạo chuyên mục tin tức, cập nhật nội dung thường xuyên cho trang, ta còn

phải tận dụng ưu thế vượt trội của các mạng xã hội phổi biến hiện nay như Facebook, Zing…

Page 43: đồ án luận văn tốt nghiệp khoa công nghệ thông tin SEO website dn24h.com lên top google

Tối ưu hóa trang web dn24h.com cho công cụ tìm kiếm GOOGLE Trang:43

Chương 4: Ứng dụng

Tự viết bài với nội dung mới lạ, thường xuyên cập nhật nội dung. Thêm vào đó là những

đoạn Video, đặt Alt, Keyword đầy đủ.Công việc này phải được làm liên tục và lâu dài.

4.4.2 Quảng bá website – tạo backlink

Việc tạo backlink tưởng chừng như đơn giản như việc: tạo tài khoản trên các mạng xã hội

như Facebook, Myspace, Google +, Yahoo, Link In… hoặc tạo tài khoản ở các diễn đàn, trang

web cùng loại khác rồi đăng bài có chèn link dễ giới thiệu, giúp các Spider biết được web nhưng

lại vướng một trở ngại lớn khi ta cố tình tạo ra nhiều backlink trong một thời gian ngắn, việc này

sẽ dẫn đến tình trạng Spam của Black Hat SEO. Cho nên, việc tạo backlink phải tiến hành trong

một thời gian dài, cùng với số lượng bài viết lớn, nhưng phải có nội dung tích cực.

Hình 20: Thống kê Backlink

Việc tạo chữ kí chứa backlink dưới các bài viết có giá trị sẽ giúp trang web kiếm thêm

được một lượng người truy cập từ các trang có danh tiếng (page rank cao), và phải thường xuyên

chăm sóc cho các bài viết này.

Trong lúc tác giả thực hiện các phương pháp SEO của mình vào trang web Dn24h.com,

cũng là thời gian Facebook đang trở thành mạng xã hội phổ biến tại Việt Nam. FanPage

Dn24h.com với gần 800 người hâm mộ (và sẽ còn tăng theo thời gian) sẽ là một công cụ hữu ích

giúp Dn24h.com có được một lượng traffic không nhỏ từ đây.

Page 44: đồ án luận văn tốt nghiệp khoa công nghệ thông tin SEO website dn24h.com lên top google

Tối ưu hóa trang web dn24h.com cho công cụ tìm kiếm GOOGLE Trang:44

Chương 4: Ứng dụng

Hình 21: Fan Page Facebook

Đề xuất tạo trang blog riêng của trang web trên Yahoo, BlogViet, Opera, Blogger, ta sẽ

tận dụng được nguồn băng thông khổng lồ, nhưng miễn phí, đồng thời sẽ là một trang thông báo

hữu dụng khi web gặp sự cố.

Việc đăng kí trang web với các Web Directories là một sáng kiến không tồi, khi mà các

Web Directories đó luôn có PR cao.

Đặt Social bookmarks lên trang web, với cách làm này, webmaster sẽ tận dụng được

nguồn nhân lực tạo backlink là lượng người truy cập vào trang web.

Tạo tệp Sitemap,đăng kí sitemap với các cỗ máy tìm kiếm như mà một công cụ hỗ trợ

Spider hiểu thêm về trang web.

Hình 22: Sitemap được đăng kí với hơn 1500 URLs

4.5 KẾT QUẢ ĐẠT ĐƯỢC

Page 45: đồ án luận văn tốt nghiệp khoa công nghệ thông tin SEO website dn24h.com lên top google

Tối ưu hóa trang web dn24h.com cho công cụ tìm kiếm GOOGLE Trang:45

Chương 4: Ứng dụng

Sau khi thực hiện nghiêm túc các biện pháp SEO, kết quả mà tác giả đạt được rất thành

công.

Về mặt từ khóa SEO: tác giả trước tiên đã Index được trang web tại các bộ máy tìm kiếm

với rất nhiều kết quả, nhưng kết quả thành công nhất là đã SEO thành công từ khóa “diễn đàn”

và “từ thiện đăk nông” vợi vị trí Top 1 và Top 2 của Google ở cùng xuất hiện ở trang 1 khi người

dùng truy vấn.

Hình 23: kết quả cùng xuất hiện ở vị trí 2 và 3 khi người dùng truy vấn tìm kiếm

Một trong những thành công, biểu hiện rõ rệt nhất là ở lượt truy cập.Vào tháng 1, khi

trang web chỉ mới xuất hiện các biện pháp quảng cáo chỉ ở mức độ truyền miệng, liên kết quảng

cáo thì lượt xem trang vào khoảng 2.000 lượt/tháng.Đến tháng 5 khi mới bắt đầu các biện pháp

SEO thì lượt xem trang có tăng, nhưng chưa rõ rệt.Cho đến tháng 11, vào thời điểm tác giả viết

báo cáo thì lượt truy cập đã tăng 200% so với tháng 5.

Page 46: đồ án luận văn tốt nghiệp khoa công nghệ thông tin SEO website dn24h.com lên top google

Tối ưu hóa trang web dn24h.com cho công cụ tìm kiếm GOOGLE Trang:46

Chương 4: Ứng dụng

Hình 24: Biểu đồ so sánh traffic các tháng

Hình 25: Thống kê chi tiết traffic các tháng

Thống kê lượng tìm kiếm từ Google: khi Page Rank của trang web chưa được xếp hạng,

traffic từ các cỗ máy tìm kiếm chủ yếu dựa vào yếu tố “kiên nhẫn” hoặc “bài viết duy nhất”. Đến

tháng 11, khi trang web được xếp PR = 3.

Tháng Traffic từ SE (%) 1 82.35 2 82.91 3 83.21 4 84.34 5 84.14 6 84.05 7 83.54 8 90.33 9 92.45 10 92.87 11 94.67

0

500000

1000000

1500000

2000000

2500000

3000000

3500000

4000000

Tháng 1 Tháng 2 Tháng 3 Tháng 4 Tháng 5 Tháng 6 Tháng 7 Tháng 8 Tháng 9 Tháng10

Tháng11

Truy cập

Page 47: đồ án luận văn tốt nghiệp khoa công nghệ thông tin SEO website dn24h.com lên top google

Tối ưu hóa trang web dn24h.com cho công cụ tìm kiếm GOOGLE Trang:47

Chương 4: Ứng dụng

Hình 26: Biểu đồ so sánh traffic từ các tháng

76

78

80

82

84

86

88

90

92

94

96

Tháng 1Tháng 2Tháng 3Tháng 4Tháng 5Tháng 6Tháng 7Tháng 8Tháng 9Tháng 10Tháng 11

SE (%)

Page 48: đồ án luận văn tốt nghiệp khoa công nghệ thông tin SEO website dn24h.com lên top google

Tối ưu hóa trang web dn24h.com cho công cụ tìm kiếm GOOGLE Trang:48

Chương 4: Ứng dụng

Bản đồ địa lý: trang web Dn24h.com có một lượng người dùng đông đảo truy cập đến từ

hơn 144 quốc gia/lãnh thổ trên toàn thế giới. Dựa vào bản đồ, ta có thể thấy được: lãnh thổ nào

có lượt truy cập nhiều, vùng lãnh thổ đó được in đậm hơn các vùng lãnh thổ ít truy cập.

Hình 27: Bản đồ thống kê lượng truy cập

Theo thống kê, Việt Nam là nước có lượt truy cập cao nhất, kế đến là lượng người dùng

tại Mỹ, Úc, Pháp…

Hình 28: Thống kê người sử dụng ở các vùng lãnh thổ (có 144 vùng quốc gia/lãnh thổ).

Page 49: đồ án luận văn tốt nghiệp khoa công nghệ thông tin SEO website dn24h.com lên top google

Tối ưu hóa trang web dn24h.com cho công cụ tìm kiếm GOOGLE Trang:49

Chương 4: Ứng dụng

Hình 29: Biểu đồ so sánh lãnh thổ truy cập với 89,34% đến từ Việt Nam

4.6 PHƯƠNG PHÁP GIỮ TOP 10 KHI SEO THÀNH CÔNG

Sau khi đã áp dụng các biện pháp SEO một cách nghiêm túc, tác giả đã có được thành

công ban đầu khi hai từ khóa “diễn đàn đăk nông” và “từ thiện đăk nông” đang giữ hai vị trí cao

nhất khi người dùng truy vấn.

Với thành công đó, tác giả đề xuất những phương pháp sau để có thể duy trì lâu dài các vị

trí đó:

Việc duy trì Top 10 của một từ hoặc cụm từ khóa còn tùy thuộc vào hiện trạng website,

mức độ cạnh tranh của từ khóa được chọn, "sức khỏe" của các website đối thủ, kinh phí và

phương pháp tiến hành cạnh tranh của bạn. Nếu từ khóa của bạn là duy nhất, bạn nên xem xét từ

đó có mang lại lợi ích gì cho sự phát triển của website không, người dùng có hay truy vấn vào

các từ khóa đấy không (bởi vì không phải việc chọn Keyword nào cũng chính xác.)Nếu không,

bạn nên dành thời gian đề tìm ra một từ mới, có ích hơn.

Khoảng thời gian để chiếm được một vị trí hàng đầu trong danh sách kết quả hiển thị trên

Yahoo, Bing sẽ nhanh hơn trên Google. Trung bình, mỗi chiến dịch chiếm lĩnh vị trí hiển thị ở

Top đầu mất khoảng 10 – 40 ngày.

Thời gian duy trì thứ hạng hiển thị phụ thuộc vào mức độ thực hiện các biện pháp duy trì

và mức độ cạnh tranh của từ khóa, nếu từ khóa có mức độ cạnh tranh cao (nhiều trang web sử

dụng) thì bạn phải không ngừng quảng bá website, thực hiện đồng bộ các biện pháp để tăng

những chỉ số mà các công cụ tìm kiếm dựa vào để đánh giá xếp hạng hiển thị.

Nếu các chỉ số đánh giá xếp hạng hiển thị website của bạn đã vượt xa các website đối

thủ, bạn không nhất thiết phải tiếp tục nỗ lực tập trung cạnh tranh.

Sau từ 3 đến 6 tháng, bạn cần xem xét có nên tiếp tục cạnh tranh thứ hạng với các từ khóa

đã được chọn nữa hay không.

Page 50: đồ án luận văn tốt nghiệp khoa công nghệ thông tin SEO website dn24h.com lên top google

Tối ưu hóa trang web dn24h.com cho công cụ tìm kiếm GOOGLE Trang:50

Chương 4: Ứng dụng

4.7 CÁC VẤN ĐỀ VỀ RANK

Một ngày không đẹp trời, kiểm tra các hệ thống thống kê, bạn nhận ra rằng: lượt truy cập

giảm đáng kể, traffic từ các bộ máy tìm kiếm cũng không khả quan, thì có thể Rank của bạn đã

giảm. Như đã biết, (chương 2) hệ thống PageRank được đánh giá dựa vào một vài chỉ số quan

trọng như: độ hữu dụng của thông tin trên trang web, độ phổ biến của trang web, chất lượng kỹ

thuật.. Vì vậy, việc đầu tiên chúng ta phải xem xét đến những vấn đề sau:

Một website trước đây có link trỏ đến trang web của bạn nhưng hiện tại link đó đã bị gỡ

bỏ thì PageRank sẽ bị giảm.

Khi bạn thiết lập Internal Link giữa các bài viết theo cách không bình thường (phần này

Matt Cutts không nói rõ nhưng theo tôi đoán có thể là quá nhiều link trong bài viết, hoặc là nhiều

links trỏ đến 1 keyword vì bạn muốn nâng rank keyword đó) cũng dẫn tới việc PageRank giảm.

Một vấn đề nữa khiến cho PageRank bị giảm rất nhiều đó là nếu để Google phát hiện ra

bạn mua bán backlink (black hat seo) với các website khác thì sẽ bị phạt (có thể giảm tới

30%).Giải pháp là xóa bỏ link mà bạn đã mua, bán với website khác và gửi yêu cầu cho Google

khôi phục lại PageRank cho mình.Nếu như sau khi Google kiểm tra thấy mọi thứ đều ổn thì sẽ

trả lại giá trị PageRank cho webpage của bạn.

Server có hoạt động bình thường không?Điều này rất quan trọng, bởi khi Server gặp sự cố thì

các Spider sẽ không tiếp cận được trang web của bạn một cách hiệu quả.

Page 51: đồ án luận văn tốt nghiệp khoa công nghệ thông tin SEO website dn24h.com lên top google

Tối ưu hóa trang web dn24h.com cho công cụ tìm kiếm GOOGLE Trang:51

Chương 5: Kết luận – Hướng phát triển

CHƯƠNG 5:

Page 52: đồ án luận văn tốt nghiệp khoa công nghệ thông tin SEO website dn24h.com lên top google

Tối ưu hóa trang web dn24h.com cho công cụ tìm kiếm GOOGLE Trang:52

Chương 5: Kết luận – Hướng phát triển

CHƯƠNG 5 – KẾT LUẬN – HƯỚNG PHÁT TRIỂN

5.1 CÁC KẾT QUẢ ĐẠT ĐƯỢC

Sau khi hoàn thành đề tài, tác giả thu được những kiến thức sau:

Tác giả đã tìm hiểu được nguyên tắc hoạt động của các bộ máy tìm kiếm, các cách thức thu thập

thông tin cơ bản của các bộ máy tìm kiếm, đồng thời hiểu được các cách áp dụng các thủ thuật

dựa trên những nguyên tắc hoạt động của bộ máy tìm kiếm nhằm giúp cho bộ máy tìm kiếm có

thể “thấy” được trang web, Index được trang web nhanh chóng và hiệu quả hơn, và đây cũng là

một công việc mang lại giá trị cốt lõi của SEO.

Với những hiểu biết đúng đắn đó, tác giả đã làm cho trang web Dn24h.com đạt được vị trí đứng

đầu khi SEO thành công từ khóa “Diễn Đàn Đăk Nông” ở cả hai trường hợp có dấu và không có

dấu. Các thủ thuật vừa nêu trên ngoài việc giúp cho các bộ máy tìm kiếm hiểu rõ được trang web

thì còn giúp cho trang web Dn24h.com đứng vị trí top 10 ở những từ khóa khác “dien dan dak

nong, đặc biệt là với từ khóa “dak nong”. Trang web Dn24h.com là một trong những trang tạo

sân chơi trực tuyến lớn nhất đăk nông nói riêng và tây nguyên nói chung.

5.2 MẶT TRÁI CỦA VIỆC SEO

Không thể phủ nhận những lợi ích mà SEO đem lại cho người dùng. Tuy nhiên, việc dùng SEO

cũng cần phải được tính toán khoa học vì:

SEO là một cuộc cân não giữa các webmaster, các webmaster phải chọn cho mình một con

đường đi đúng đắn. Người thắng cuộc là người trang bị đầy đủ kiến thức, kĩ năng và cả sự may

mắn, bởi vì không phải lúc nào làm SEO cũng thành công.

Chuyện “rớt top” là không thể tránh khỏi, khi mà các nhà đầu tư quyết định dựa vào Google

Adsense, một hình thức quảng cáo “Ưu tiên top 1” của Google. Hơn nữa, các đối thủ cạnh tranh

trực tiếp luôn muốn chiếm hữu từ khóa của bạn. Vì vậy, bạn phải nỗi lực hơn nữa để có thể giữ

vị trí cao. Do đó, công việc này phải tiến hành bền bỉ theo thời gian.

Thực tế thì bất cứ ngành nghề nào cũng có những yếu tố khách quan chi phối, còn đối với SEO

thì nó thực sự bị ảnh hưởng bởi các bộ máy tìm kiếm.Các thuật toán của bộ máy tìm kiếm luôn

đổi mới để tránh Black Hat Seoer lạm dụng.Điều này cũng vô tình khiến các White Hat Seoer

gặp khó khăn, khi mà những thay đổi đó không bao giờ công bố rộng rãi. Các White Hat Seoer

phải bắt đầu lại từ con số 0 cùng với kinh nghiệm tích lũy trước đó của mình.

SEO cũng chỉ là những kĩ thuật nhất định, quan trọng nhất vẫn là một website có nội dung, nội

dung website sẽ quyết định số lượng thành viên và số lượng truy cập vào trang web đó.

5.3 ĐỀ XUẤT HƯỚNG PHÁT TRIỂN CHO SEOER

SEO chứa đựng nhiều rủi ro nhưng không phải vì thế mà bạn từ bỏ nó. Zing thành công nhờ

lượng traffic lớn từ SEO, đại siêu thị Vật Giá có được lượng visitor như hôm nay thì SEOer là

những công thần; VnExpress, Thanh Niên đã bắt đầu thực hiện SEO hay bé nhỏ hơn là gian hàng

Page 53: đồ án luận văn tốt nghiệp khoa công nghệ thông tin SEO website dn24h.com lên top google

Tối ưu hóa trang web dn24h.com cho công cụ tìm kiếm GOOGLE Trang:53

Chương 5: Kết luận – Hướng phát triển

online đủ nuôi sống mình ngày càng phát triển cũng nhờ SEO... SEO chỉ thất bại khi bạn không

có đầu tư thỏa đáng, không có một kiến thức vững vàng và một chiến lược phù hợp, và quan

trọng hơn cả là sự kiên nhẫn của bạn cùng với một yếu tố may mắn.

Bên cạnh đó, tác giả đề xuất những phương pháp để phát triển trang web Dn24h.com để giúp

trang web này đứng vững ở vị trí cao ở những từ khóa khác:

Hình 39: Sơ đồ duy trì và phát triển diễn đànDn24h.com

Đầu tiên, để có thể tự duy trì diễn đàn, ta phải đặt banner để có thể kiếm thêm thu nhập, số tiền

này sẽ được bổ sung vào chi phí nâng cấp hosting, và trang trải chi phí Google Adsense nếu thật

sự cần thiết.

Việc phát triển nội dung của trang web không thể thiếu,vì với lượt truy cập khổng lồ như vậy,

lượng thông tin cần có phải đáp ứng đủ nhu cầu của người sử dụng.

Nghiên cứu SEO thêm các từ khóa mới là một sáng kiến tốt cho một trang web có đông nhân

lực.

Việc kiểm tra duy trì backlink, duy trì các từ khóa cũ phải được tiến hành, bởi vì đó là “định

hướng ban đầu” của diễn đàn.

Tìm cách tạo ra càng nhiều Backlink có giá trị nhằm tăng PR.

5.4 LỜI KẾT

Page 54: đồ án luận văn tốt nghiệp khoa công nghệ thông tin SEO website dn24h.com lên top google

Tối ưu hóa trang web dn24h.com cho công cụ tìm kiếm GOOGLE Trang:54

Chương 5: Kết luận – Hướng phát triển

Nhìn chung, SEO chỉ là những kĩ thuật, hay nói chính xác hơn là những thủ thuật của các

webmaster nhằm làm quảng bá website, làm cho site của mình được xuất hiện trên bộ máy tìm

kiếm và “xuất hiện ở trên cao càng tốt”.

Những kĩ thuật nêu trên chỉ đơn thuần là kĩ thuật cơ bản, bất cứ website nào cũng phải có. Quan

trọng nhất của SEO vẫn là nội dung của site. Nội dung site sẽ quyết định số lượng thành viên và

số lượng người truy cập của site đó.

SEO đôi khi cũng không thành công.Việc SEO thành công không phải là việc làm một sớm một

chiều được. SEO tốt đòi hỏi một đội ngũ Ban Quản Trị có kĩ năng và sự nhiệt huyết.

---------HẾT----------

Page 55: đồ án luận văn tốt nghiệp khoa công nghệ thông tin SEO website dn24h.com lên top google

Tối ưu hóa trang web dn24h.com cho công cụ tìm kiếm GOOGLE Trang: 55

Tài liệu tham khảo

TÀI LIỆU THAM KHẢO

- Application and Research of SEO in The Development of Web2.0 Site – Tác giả: Chengling

Zhao, Jiaojiao Lu, Fengfeng Duan

- How to Improve Your Google Ranking Myths and Reality – Tác giả: Ao-Jan Su†, Y. Charlie

Hu‡, Aleksandar Kuzmanovic†, and Cheng-Kok Koh‡

- The Application of Search Engine Optimization for Internet Marketing An Example of the

Motel Websites

- Mattcutts Website - http://www.mattcutts.com/blog/

- Search Engine Optimization Starter Guide – được cung cấp bởi Google.

- Ebook Cẩm nang SEO toàn tập 2011 – TapchiSEO.com

- SEO made Easy - Brad Callen.

- Hội quán tin học - http://hoiquantinhoc.com/

- How to Seo forum vbulletin - http://hoiquantinhoc.com/showthread.php/33097-Seo-cho-

di%E1%BB%85n-%C4%91%C3%A0n-vbb-How-to-Seo-forum-vbulletin

- Thế giới SEO Việt Nam - http://www.thegioiseo.com/diendan/forum.php

- [*] http://eblogviet.com/thu-thuat/site-speed-them-mot-yeu-to-moi-giup-tang-thu-hang-tren-

google.html

- SEO Worder: http://www.seoworkers.com/seo-articles-tutorials/search-engine-

optimization.html