Google làm việc như thế nào ?

Bắt đầu với dự án do Lary Page và Sergey Brin đứng đầu , là hai sinh viên của chương trình Cao học của trường Đại học Stanford , và bây giờ đã trở thành công ty có tầm ảnh hưởng nhất trên Internet đó là Google .

Ban đầu , mục tiêu của những sinh viên này là tạo ra công cụ tìm kiếm hiệu quả là đưa cho những người dùng những liên kết có liên quan tới những yêu cầu tìm kiếm . Ngày nay Google vẫn cung cấp dịch vụ Tìm kiếm , nhưng bên cạnh đó còn cung cấp một loạt những dịch vụ khác như Email , lưu trữ văn bản … Chỉ trong thời gian chưa tới mười năm , Google đã trở thành tập đoàn với giá trị nhiều tỉ USD .

Ngày nay Google vẫn tiếp tục phát triển . Trong năm 2007 , Google vượt trội Microsoft để trở thành trang Web có nhiều người truy cập nhất trên thế giới . Ảnh hưởng của Google trên Internet là không thể phủ nhận . Tất cả mọi nhà quản trị trang Web đều mong muốn trang Web của mình có trong danh mục tìm kiếm ở mức cao trong trang kết quả tìm kiếm của Google SERP ( Searcg Engine Result Page ) , bởi vì điều đó đồng nghĩa với việc trang Web đó sẽ có nhiều người ghé thăm . Bên cạnh đó Google cũng mua lại những công ty Internet khác từ những dịch vụ Blog cho tới trang Wen chia xẻ Video YouTube . Công nghệ tìm kiếm của Google thậm trí còn mạnh hơn những công cụ tìm kiếm của những công ty đối thủ khác , trước kia Yahoo cũng dựa vào Google để tìm kiếm và cho tới năm 2004 thì họ tự phát triển công nghệ tìm kiếm cho riêng mình .

Ảnh hưởng của Google là không giới hạn trên Web . Trong năm 2007 , Google thông báo về việc dự định tham gia phiên đấu giá phổ Wireless ở băng tần 700MHz . Một phần trong phổ băng tần 700MHz chính là tham gia vào hệ thống TV thông thường , Google tham gia vào cuộc đấu giá này để tăng cường sự cạnh tranh trong những dịch vụ không dây . Google sẽ hỗ trợ những công nghệ mở để cho phép bất kì dịch vụ không dây được dùng trên mọi thiết bị của hầu hết những nhà cung cấp mà không bị hạn chế do nhà sản xuất . Google đã trả giá 4.6 tỉ USD để tham gia cuộc đấu giá này .

Google quan tâm tới phổ tần số 700MHz để xâm nhập vào thị trường điện thoại di động . Nhiều tin đồn nói rằng họ đang thiết kế điện thoại di động GPhone để xử dụng những tiện ích trên Internet .

Andy Rubin là Giám đốc nền tảng Mobile của Google đã thông báo kế hoạch GPhone . Tuy nhiên ông này tiết lộ về việc Google đứng sau hỗ trợ cho nền tảng phần mềm thiết bị di động với tên gọi Android , mà bao gồm hệ điều hành cho SmartPhone , giao diện người dùng và những ứng dụng

Bộ máy tìm kiếm của Google

Bộ máy tìm kiếm của Google là một công cụ có sức mạnh lớn nhất . Không có Bộ máy tìm kiếm nào như Google , thực tế nó có khả năng tìm được những thông tin bạn cần khi lướt Web . Như tất cả Bộ máy tìm kiếm , Google sử dụng thuật toán đặc biệt để tạo ra những kết quả tìm kiếm . Trong khi Google chia xẻ những lí thuyết chung về thuật toán của mình nhưng có một số phần là bí mật của họ . Điều đó trợ giúp cho Google thống trị những công cụ tìm kiếm khác trên Web và giảm cơ hội để ai đó tìm ra và sử dụng nó trên hệ thống Web .

Google dùng phần mềm tự động có tên gọi là Spider hoặc Crawler , cũng như hầu hết những Bộ máy tìm kiếm khác . Và cũng như hầu hết những Bộ máy tìm kiếm khác , Google có danh mục từ khoá ( Keyword ) lớn và những từ khóa này có thể tìm được bất kì ở đâu .  Những vấn đề đó chính là một phần trong cách Google hiển thị trong những trang kết quả tìm kiếm ( SERP ) . Google đã dùng thuật toán mà tên thương mại gọi là PageRank , nó gán mỗi trang Web một số điểm tương ứng .

Spider có thể làm được những gì

Spider là một bộ máy tìm kiếm làm việc liên tục . Nó quét những trang Web và tạo những danh mục theo từ khoá . Chỉ cần một lần ghé vào , quét và phân loại trang Web , nó sẽ tạo thành những đường liên kết từ trang này tới trang khác . Spider sẽ tiếp tục “trườn” từ một trang rồi tới trang tiếp theo , điều đó khiến cho Danh mục tìm kiếm ngày càng trở nên bao trùm và tăng cường sức mạnh . Chúng tôi đã có bài viết “ Công cụ tìm kiếm làm việc như thế nào “ các bạn nên tìm đọc để hiểu kĩ hơn

PageRank của trang Web phụ thuộc vào một số nhân tố sau :

  • Tần số xuất hiện và vị trí của những Keyword bên trong trang Web . Nếu Keyword chỉ xuất hiện một lần bên trong thân của trang Web thì Từ khoá đó sẽ nhận Số điểm tương ứng thấp .
  • Trang Web đã tồn tại được trong bao lâu . Hàng ngày có rất nhiều trang Web được xuất hiện và không phải tất cả chúng đều tồn tại trong một thời gian dài . Google đánh giá cao những trang Web đã tồn tại lâu .
  • Số những trang Web khác là liên kết tới trang Web trong yêu cầu . Google tìm kiếm xem có bao nhiêu trang Web liên kết tới trang khác để xác định tính liên quan .

Trong ba nhân tố trên , thì nhân tố thứ ba là quan trọng nhất .

Ví dụ khi tìm kiếm “Planet Earth” , nếu có nhiều trang Web liên kết tới trang Planet Earth của Discovery thì vị trí của trang Discovery tăng lên . Khi vị trí của trang Discovery cao hơn những trang khác thì nó sẽ xuất hiện đầu tiên trong trang tìm kiếm kết quả của Google .

Bởi vì Google đánh giá cao sự liên kết tới trang Web vì thế không dễ dàng để gian lận . Cách tốt nhất để bảo đảm trang Web được Google đánh giá cao thì cần cung cấp nhiều nội dung để mọi người sẽ phải kết nối nhiều tới trang Web của bạn . Càng nhiều đường Link tới trang Web của bạn thì PageRank sẽ có số điểm càng cao .

Google đã dùng nhiều thủ thuật để ngăn chặn mọi người gian lận hệ thống để có vị trí cao trong SERP . Ví dụ trang Web thêm những đường Link tới nhiều trang thì sức mạnh của “phiếu bầu” cho nó lại giảm đi . Trang Web có PageRank cao lại có nhiều đường liên kết ra bên ngoài thì có thể có ít ảnh hưởng hơn những trang Web có PageRank thấp hơn mà lại chỉ có một hoặc hai đường Link ra bên ngoài

 Những dịch vụ của Google

Hiện nay Google đã thêm những dịch vụ mới cho người dùng . Một số những dịch vụ được thiết kế để trợ giúp tìm kiếm trên mạng một cách hiệu quả hơn và hợp lí hơn , trong khi những dịch vụ khác được tạo ra để cạnh tranh với những đối thủ khác .

Những tìm kiếm cao cấp của Google được mở rộng từ những giao thức tìm kiếm thông thường của họ . Với những tìm kiếm đặc biệt , bạn có thể tìm kiếm theo phạm vi hẹp hơn . Bạn có thể vào từ khoá trong Google và tìm kiếm

  • Những hình ảnh liên quan tới từ khoá
  • Bản đồ
  • Những bài báo , những tin tức hoặc những cảnh
  • Những danh mục trong Blog có từ khoá
  • Những đoạn Video
  • Những bài báo khoa học …

Với những kiểu tìm kiếm này , Google tạo thành những danh mục riêng biệt mà chỉ bao gồm những nguồn liên quan . Ví dụ nếu bạn tìm theo từ khoá “Planet Earth” thuộc lĩnh vực tin tức thì kết quả sẽ chỉ có những bài liên quan tới tin tức chứa những cụm từ này mà thôi .

Trong mấy năm trước , Google đã cho ra mắt những dịch vụ không liên quan tới Công cụ tìm kiếm .Ví dụ Gmail là chương trình Email miễn phí . Khi dịch vụ này được đưa ra lần đầu tiên , Google hạn chế số người dùng sử dụng thiết lập Tài khoản . Những người dùng đầu tiên có thể mời hạn chế số người gia nhập vào dịch vụ này , do đó lời mời này của Google đã trở thành mặt hàng trao đổi .

\"\"

 
Google cũng tổ chức những Email thành những Conversation . Điều đó có nghĩa là khi bạn gửi Email tới một ai đó và họ gửi trả lời thì cả hai Email này được nhóm lại cùng với nhau thành chuỗi trong Inbox của bạn . Nó làm cho chúng ta dễ dàng theo dõi việc Email trao đổi với nhau . Nếu bạn trả lời lại tới những người bạn của mình , Google sẽ gắn những Email xuống phía dưới của chuỗi .

Dịch vụ miễn phí khác của Google là Google Docs , cơ sở dữ liệu lưu trữ và kết hợp với chương trình xử lí văn bản tên ban đầu gọi là Writely . Thiết lập tài khoản Docs hoàn toàn miễn phí và cho phép bạn lưu trữ tới 5000 tài liệu và hình ảnh Online .Mỗi tài liệu có thể với dung lượng 500KB , và mỗi hình ảnh đi kèm có thể là 2MB . Bạn có thể chia xẻ những tài liệu trên Google Docs , để cho phép những người bạn của mình xem và thay đổi nội dung . Bạn có thể lưu trữ tất cả tài liệu trên những máy chủ của Google và truy cập bất kì nới nào có kết nối Internet .

Tìm kiếm nâng cao

Bằng việc tìm kiếm nâng cao , có thể dùng Google để lấy lại những kết quả liên quan nhất tới từ khoá của bạn . Bạn có thể tìm kiếm những tài liệu được viết bằng những ngôn ngữ nào đó hoặc được lưu trong một định dạng File nào đó như PDF hoặc RTF . Bạn có thể nói Google tìm những từ khoá này ở đâu như ở đầu trang hoặc trong những tiêu đề của trang . Google thậm trí cho phép bạn hạn chế tìm kiếm trên một tên Domain .

Mỗi lựa chọn bạn thực việc với Google sẽ tạo thành danh mục để sử dụng khi bạn muốn quay trở lại những kết quả đã được tìm kiếm .

Những tiện ích của Google

Google đưa ra công cụ phổ thông gọi là Google Maps , là dịch vụ đồ bản Online tương tự như MapQuest . Google sử dụng nguồn bản đồ từ những công ty như NAVTEQ và TeleAtlas và những dữ liệu vệ tinh của DigitalGlobe và MDA , để tạo thành những bản đồ tương tác . Bạn có thể dùng bản đồ của Google để xem vị trí của địa chỉ hoặc tìm đường đến đích ( hiện tại chỉ thực hiện trong những thành phố lớn tại Mỹ ) .

Google Maps có một số kiểu xem . Map View là bản đồ con đường cơ bản , Satellite View cho thấy những con đường trên cùng như kiểu ảnh chụp vệ tinh của vùng đó , Terrain View tạo nên bản đồ địa hình với những con đường phủ trồng lên nhau , và Traffic View sử dụng màu Đỏ Vàng và Xanh lá cây để chỉ những con đường chính trong vùng . Kiểu Street View chỉ cho phép lựa chọn xem những thành phố tại Mỹ , xem những thành phố được chọn như Orlando . Bạn có thể tìm tới những thành phố chỉ bằng cách bấm vào mũi tên trong bức ảnh và có thể quay nó thành những góc 360o .

Google Maps cũng có thể kết hợp với những thông tin kinh doanh . Ví dụ bạn muốn ăn Sushi ở San Francisco bạn có thể gõ “sushi, San Francisco” và bấm nút Search , Google Maps sẽ hiển thị bản đồ thành phố với một số vị trí của những của hàng bán sushi .

\"\"

 
Sản phẩm liên quan tới Google Maps chính là Google Earth ( chúng tôi đã có bài chỉ tiết nói về Google Earth trong mục Tri thức ) , là bản đồ số hoá toàn cầu . Nó dùng cùng bản quyền những hình ảnh vệ tinh với Google Maps , nhưng bạn phải tải về và cài đặt nó trong máy tính . Google Earth yêu cầu kết nối Internet để có thể hoạt đọng được với đầy đủ các chức năng , và bạn vẫn có thể xem được vị trí trên Trái đất thậm trí khi đứt kết nối .

Google Toolbar là một công cụ khác dùng cho FireFox hoặc Internet Explorer . Thanh công cụ này có những nút tuỳ biến . Mỗi nút chứa đựng những chức năng riêng biệt mà có thể bao gồm mọi thứ từ xem PageRank của trang Web tới dịch từ ngôn ngữ này sang ngôn ngữ khác .

\"\"

 
Google Desktop là ứng dụng miễn phí bạn có thể tải về . Chương trình này cho phép bạn tìm kiếm máy tính của mình theo cách Công cụ tìm kiếm của Google sử dụng trên Internet .

Bạn cũng có thể tải Google Gadgets , là một phần mềm tích hợp nhiều thứ trên màn hình máy tính của bạn như :đồng hồ , lịch , tin tức cập nhật , bản tin thời tiết ….

Thu nhập của Google 

Không như một số công ty Internet , Google có nhiều cách để tạo ra doanh thu hơn là đi đầu tư hoặc bán cổ phiếu trên thị trường chứng khoán . Google dùng ba cách kết hợp với đối tác để kinh doanh và quảng cáo đó là : Google Checkout , Google AdWords Google AdSense .

Google Checkout là dịch vụ thiết kế cho việc mua bán Online trở nên dễ dàng hơn cho cả người mua hàng và những người bán lẻ . Về phía người mua hàng họ cần tạo một tài khoản Google Checkout miễn phí . Trong tài khoản này bạn phải vào số thẻ tín dụng hoặc thẻ ghi nợ , Google sẽ lưu trữ nó trong cơ sở dữ liệu an toàn . Khi người dùng tới nhà bán lẻ và đặt mua thanh toán bằng Google Checkout và Google sẽ làm cho việc này trở nên thuận tiện . Điều đó có nghĩa là người mua hàng không cần đưa số thẻ khi đi mua bán .

Những người bán lẻ có thể thiết lập tài khoản Google Checkout miễn phí . Nhưng từ tháng Hai 2008 , Google thu phí 2% và thêm 20 xu cho chi phí giao dịch . Nếu người mua hàng trị giá 10USD thì Google sẽ thu 40 xu từ phía người bán lẻ .

Cách khác để Google tạo ra thu nhập đó là qua hai dịch vụ quảng cáo qua Web đó là AdWordsAdSense .  Với AdWords , người đăng quảng cáo có thể đưa ra những quảng cáo tới Google bao gồm những danh sách những từ khoá liên quan tới sản phẩm , dịch vụ hoặc kinh doanh . Khi người dùng Google tìm kiếm trên Web dùng một trong nhiều từ khoá đó thì quảng cáo sẽ xuất hiện trên SERP tại thanh bên cạnh . Người đăng quảng cáo sẽ trả tiền cho Google mỗi khi người dùng bấm vào đường Link trên quảng cáo .

\"\"

 

 

 

Google mua lại

Google không nổi tiếng trong việc tạo ra và cung cấp những dịch vụ hữu ích , mà nhờ vào việc mua lại một số công ty khác và kết hợp lại với nhau . Bao gồm YouTube là trang Web chia xẻ Video , Blogger dịch vụ Blog , Picasa dịch vụ chia xẻ File ảnh chụp và Jaiku dịch vụ SMS và Micro-Blog

 

AdSense cũng tương tự như vậy , loại trừ việc hiển thị quảng cáo trên SERP của Google , Webmaster có thể lựa chọn tích hợp quảng cáo vào trang Web của mình . Spider của Google sẽ lùng sục trong trang Web và phân tích nội dung . Sau đó Google chọn quảng cáo những từ khoá liên quan ngay trên trang Web của Webmaster đó theo những từ khoá mà nó dò tìm . Webmaster có thể tuỳ ý đặt vị trí và màu sắc của thanh nội dung quảng cáo . Bất kì lúc nào khi ai đó bấm vào đường Link quảng cáo trên trang Web đó thì Webmaster sẽ nhận được một phần tiền quảng cáo ( hoàn toàn phụ thuộc vào thống kế của Google ) mà người đăng quảng cáo trả cho Google .

 

\"\"

Bằng cả AdWords và AdSense , chiến lược của Google là cung cấp những quảng tới tận người dùng cuối cùng . Google tin rằng bằng việc cung cấp quảng cáo liên quan tới những thông tin mà người dùng tìm kiếm là cơ hội quảng bá sản phẩm , dịch vụ và kinh doanh cho người đăng quảng cáo .

Trang thiết bị của Google

Quay trở lại những năm 1998 , thiết bị của Google tương đối hiện đại bao gồm

·          Hai máy chủ 300MHz Dual-Pentium II với 512MB RAM

·          Máy tính 04 bộ vi xử lí F50 IBM RS6000 với 512MB RAM

·          Máy tính Dual-CPU Sun Ultra II với 256MB RAM

·          Nhiều ổ cứng từ 4 tới 9GB có dung lượng tổng cộng lên tới 350GB .

Ngày nay , Google dùng hàng nghìn máy chủ để cung cấp dịch vụ cho người dùng . Chiến lược của Google là dùng những máy không đắt lắm để chạy hệ điều hành riền của mình dựa trên Linux . Chương trình với tên gọi Google File System để quản lí dữ liệu trên những máy chủ của Google .

Google dùng nhiều máy chủ cho những nhiệm vụ khác nhau . Những máy chủ Web của Google nhận và xử lí những câu hỏi của người dùng , gửi những yêu cầu lên máy chủ thích hợp tiếp theo . Những máy chủ danh mục lưu trữ những danh mục và những kết quả tìm kiếm của Google . Google dùng những máy chủ tư liệu để lưu trữ tóm tắt tìm kiếm , thông tin người dùng , Gmail và những File của Google Docs . Những máy chủ quảng cáo lưu trữ hiển thị quảng cáo trên những trang tìm kiếm .

Google không công bố về việc họ có bao nhiều máy chủ , nhưng theo đánh giá khoảng từ 200.000 tới hơn 450.000 máy chủ .

Google chia thông tin trên mỗi máy chủ danh mục thành những khối 64MB . Mỗi khối có ba bản Copy dữ liệu , mỗi bản Copy được lưu trữ trên những máy chủ khác nhau và chạy trên những nguồn điện riêng biệt . Những khối dữ liệu được phân bổ nửa ngầu nhiên do đó mà không có hai máy chủ chứa cùng những khối dữ liệu . Bằng cách như vậy nếu một máy chủ có vấn đề thì dữ liệu vẫn còn được tồn tại trong những máy khác . Dùng nhiều bản Copy dữ liệu để ngăn chặn việc ngắt dịch vụ có tên gọi Redundancy ( như sử dụng trong RAID 5 ) .

Mỗi một tập hợp máy chủ được một máy tính kiểm soát . Công việc của máy tính kiểm soát là giữ dấu vết của những máy chủ giữ mỗi khối dữ liệu khi kết thúc thảm hoạ . Nếu một máy chủ bị sập , máy tính kiểm soát định hướng lại tất cả sự lưu thông dữ liệu tới những máy chủ khác mà có cùng dữ liệu .

Google và Băng thông

Một số Webmaster có cảm tưởng những Spider của Google tiêu tốn quá nhiều của họ Băng thông một tháng . Khi Spider theo đương liên kết tới trang Web làm cho băng thông sử dụng tăng lên . Hầu hết những dịch vụ Web Hosting đều thu tiền những Webmaster vì tiêu tốn băng thông vượt quá mức quy định . Nếu những Webmaster cảm thấy những Spider của Google làm cho họ bị tiêu tốn tiền , họ có thể tạo File Robot.txt trong thư mục gốc của trang Web mà sẽ nói với Spider bỏ qua trang Web này .

 \"\"\"\"