入力したキーワードに最適な情報を表示するために、サーチエンジンは日々オンライン上に存在するwebサイトを閲覧し情報を取得しています。
何億、何千億とあるwebページですから、もちろん人間が閲覧しているわけではありません。
bot、クローラー、スパイダーなどとよばれる自動収集プログラムがサイトのあらゆるリンクを辿ったりしながら高速で情報を集めています。
集められた情報はグーグルのサーバーに蓄積され、評価基準に沿ってランク付けされます。
このランクが高いページがキーワードとマッチし検索上位に表示されます。
この評価基準がポイントなのですが、詳細な項目は秘匿であり日々更新されているので確定的な物がありません。
日々の検証を重ねて改良していくことがseoには必要な要素です。
グーグル検索の仕組み資料
【小話】検索エンジンは著作権侵害?
検索エンジンは他人のネット上の情報を「キャッシュ」(表示を早くするために情報を仮に取得しておく仕組み)として取得し、編集し検索結果として表示しているため、著作権を侵害しているのでは?という議論があります。
学術的なところからはじまったインターネットは「webに公開されている物はみんなの物。見られたくないものは掲載しなければよい」の概念もありましたが、現在はそれでは通用しません。
最近ではスポーツの結果やグーグルマップが意図しないのに表示されたり、google booksなど実際に著作権侵害で訴えられて裁判になった事例もあるようです。
AMPというCDN(コンテンツデリバリーネットワーク)を利用した高速表示の仕組みもインターネット上にある情報をスクレイピング(ウェブサイトから情報を抽出するコンピュータソフトウェア技術)しているようなものではないでしょうか。
グーグルだけでなくスマートニュース、グノシーなども「キャッシュ」を保存し、アプリで配信して広告料などで利益を得ているサービスもあります。
SmartNewsは違法アプリ? ニュースアプリの仕様と著作権の関係
参考http://www.excite.co.jp/News/android/20130616/Androidsmart_65504.html?_p=2
グーグルは社会性が高いから・・・というなら似たようなサービスはどうなのかと説明がつきません。
サーバーが海外にあったり、著作権だけではなく肖像権も。YOUTUBEの公衆送信権は?などなど問題がからみあっていて現実がネットに追いついていないのが現状のようです。