※技術検証用にページを作成したのですが検証する対象が多かったため、一覧ページにしました。各技術については検証が終了次第掲載予定です。
スポンサードリンク
背景と目的
GFS(GoogleFileSystem)の素晴らしさに触発され、何か一つ分散ファイルシステムを体験してみようというコンセプト。 検査のためにコンピュータを用意するのは直観的だけれど、今回は何台か必要なので&検証なのでVMを利用したい。
ところで、なぜDFSが必要なのだろうか。システム管理者はシステムとハードウェアを常に監視していなければならない。日々バックアップを取り、週末にはサーバを停止してディスクチェックを行い、遅れがちなクライアントのメンテナンスでハードウェアクラッシュがありその対応に追われる。
少なくともデータをネットワーク上(NAS)に配置しておけばこれらの恐怖感から解放されることになる。しかし、NASの重要性はますます高まり、壊れていないのに定期的に交換し、また特殊なハードウェアのため、検査に時間がかかったり検査ができなかったりする。こうして新しい恐怖に駆られることになる。
そこで、DFSの出番である。DFSは壊れないファイルシステムといえよう。各々のデータは細分化されそれぞれのサーバに分散される。ここまではRAIDと同じような印象である。しかし、DFSはスケーラブルであり、どのような環境のシステムでも直ちに参加でき、あるいは分離できることが特徴的である。さらに、障害が発生した場合には自動的にそれを除外して処理を続行する。
GoogleはGoogleFileSystem(GFS)等による大規模なテストの結果として、1800台のうち1600台が故障しても耐えられるとしている。このテストは1800台のサーバのうち、80台の電源を引っこ抜いたとされている。
事前準備
前提条件として自前でサーバーを公開できるレベルがあるものとする。
参考資料
- asahi.com(朝日新聞社):BIGLOBE、低コストストレージを活用した「PCバックアップサービス」 – e-ビジネス情報(提供:BCN) – デジタル :どんなコンテンツをお探しですか?:朝日新聞デジタルどんなコンテンツをお探しですか?:朝日新聞デジタル
- Roma、Fairyについてひとことふたこと – 古橋貞之の日記 :Roma、Fairyについてひとことふたこと - Blog by Sadayuki Furuhashi大規模分散処理向けの国産“ウェブOS”をRubyで開発中 - @ITより。これはマズイことになった。WikiFormeを作っている内に、VIVER構想の一部が先に実現されてしまいそうだ。 以下、私はこのカンファレンスに行ってもいませんし、とっても浅薄な頭で書いてますので、あまり信用してはいけません。 まずRomaについ...
- 画像配信の負荷分散も比較的簡単?(その1) – 最速配信研究会 :2006-04-26最速配信研究会(@yamaz)
- 画像配信の負荷分散も比較的簡単?(その2) – 最速配信研究会 :2006-05-08最速配信研究会(@yamaz)
- 画像配信の負荷分散も比較的簡単?(その3) – 最速配信研究会 :2006-05-09最速配信研究会(@yamaz)
- 画像配信の負荷分散も比較的簡単?(その4) – 最速配信研究会 :2006-05-10最速配信研究会(@yamaz)
- 画像配信の負荷分散も比較的簡単?(その5) – 最速配信研究会 :2006-06-22最速配信研究会(@yamaz)
- 画像配信の負荷分散も比較的簡単?(その6) – 最速配信研究会 :2006-06-26最速配信研究会(@yamaz)
◆mixi
- ★関口秀之のJust Do IT★ > ★mixiを支えるシステムとは?★ : ITmedia オルタナティブ・ブログ :★mixiを支えるシステムとは?★:★関口秀之のJust Do IT★:オルタナティブ・ブログ株式会社イーツリーズ・ジャパン社の「freeocean」 という 革新的なサーバ...
- PostgreSQLで効率的な負荷分散を実現し、モバゲーやmixiを追撃 - TechTargetジャパン :PostgreSQLで効率的な負荷分散を実現し、モバゲーやmixiを追撃携帯電話向けのSNSサイトを運営するオープンドアは、システム基盤にPostgreSQLを採用。サービス別のDB分散とPostgreSQLの拡張ツールを活用したDBレプリケーションにより、効率的な負荷分散の仕組みを構築した。
- ミクシィのCTOが語る「mixiはいかにして増え続けるトラフィックに対処してきたか」:ITpro :ミクシィのCTOが語る「mixiはいかにして増え続けるトラフィックに対処してきたか」東京都大田区で開催されているPerl技術者向けカンファレンス「YAPC::Asia 2006 Tokyo」で2006年3月29日,日本最大のソーシャル・ネットワーキング・サイト(SNS)である「mixi」を運営するミクシィのBatara Kesuma(バタラ・ケスマ)取締役最高技術責任者(CTO)が,増え続ける膨大な...
- mixiの生みの親“バタラ氏”が語るMySQLの意外な利用法 - TechTargetジャパン :mixiの生みの親“バタラ氏”が語るMySQLの意外な利用法サービス開始から3年余りで会員数が1000万人を超えたSNSの「mixi」。そのシステムはOSSで構築されており、データベース管理システム(DBMS)には「MySQL」を使う。急増するトラフィックをさばくために負荷分散を重ねた結果、現在ではサーバ1000台以上が連なる超分散システムへ。その中でMySQLが果たす役割とは...
◆Gfarm
- Gfarm Documentation :http://datafarm.apgrid.org/document/
- KEK:News@KEK(大量のデータ処理手法で優勝) :301 Moved Permanently
- NTTネオメイト|コールセンタサービス :http://www.ntt-neo.com/news/2005/050701b.html
- 分散ストレージについて再び(6) – 近況 :301 Moved Permanently
◆MogileFS
- Six Apart – Tech Talk Blog: MogileFS::Client と MogileFS 内部でのファイルノード管理 :301 Moved Permanently
- Six Apart – Tech Talk Blog: 分散ファイルシステム MogileFS について :301 Moved Permanently
- Six Apart – Tech Talk Blog: MogileFS のインストールと初期設定 :301 Moved Permanently
◆cagra
- MOONGIFT: » C++製の分散ストレージシステム「cagra」:オープンソースを毎日紹介 :http://www.moongift.jp/2008/04/cagra/
- P2P分散ストレージ「Cagra」 – 古橋貞之の日記 :P2P分散ストレージ「Cagra」 - Blog by Sadayuki Furuhashiid:nyaxt氏との共同開発の分散ストレージ「Cagra」(かぐら)のアルファ版をリリースしました。 cagra α3リリース cagra テクニカルデモ α2リリース 分散ストレージエンジンテクニカルデモ α版リリース cagraのα版試してみたよ - takumalog Cagraは以下のような特徴を持った(目指...
- 2008-04-22 – nyaxtのPC作業ログ :2008-04-22nyaxtのPC作業ログ
◆Cleversafe
- Cleversafeは好奇心を引くオープンソースプロジェクト – IT運用スペシャリストのためのブログ :はてなブログはてなブログは、無料でしっかり書けるブログサービスです。日々の生活から感じたこと、考えたことを書き残しましょう。
- Cleversafe、分散ストレージ ネットワークの商用化に着手 – japan.internet.com Webビジネス :http://japan.internet.com/busnews/20080219/12.html
- 「ストレージ2.0」いよいよ発進 : オープンソース – Computerworld.jp :http://www.computerworld.jp/topics/osst/69049.html
◆LustreFS
- Lustreファイルシステムの概要 :404 Not Found
- lustre – 詳解ファイルシステム – livedoor Wiki(ウィキ) :lustre - 詳解ファイルシステムFrontPage詳解Lustre詳解LustreLustreとは Lustreの特徴1 Lustreの特徴2 Lustreの特徴3 lustreの使い方詳解 その他諸元(2006/03/28 現在)LustreとはLustreとは、Cluster File Systems, In...
- Lustre File System – Overview :Hardware | OracleLower total cost of ownership with powerful on-premises Oracle hardware solutions that include unique Oracle Database optimizations and Oracle Cloud Infrastruct...
◆OpenAFS
- 囲い込まれた分散データを支援するOpenAFS :IBM Developer
- Gentoo Linux Documentation — Gentoo Linux OpenAFS Guide :http://www.gentoo.org/doc/ja/openafs.xml
- MOONGIFT: » 成熟した分散化ファイルシステム「OpenAFS」:オープンソースを毎日紹介 :http://www.moongift.jp/2008/05/openafs/
◆Hadoop
- Hadoopのインストールとサンプルプログラムの実行:CodeZine :301 Moved Permanently
- 複数マシンへHadoopをインストールする:CodeZine :301 Moved Permanently
- Apache Hadoop のプロジェクト詳細 :http://projects.terra-intl.com/projects/hadoop.html
- InfoQ: Googleライクなオープンソースインフラストラクチャ「Hadoopプロジェクト」が弾みをつける :Googleライクなオープンソースインフラストラクチャ「Hadoopプロジェクト」が弾みをつけるこの一年の間、GoogleライクなインフラストラクチャであるHadoopプロジェクトは、開発コミュニティによって広く知られるようになった。
◆GoogleFS(Googleが内部利用している→Hadoop)
- Google Research Publication: The Google File System :Error 404 (Not Found)!!1
- MapReduce:Simplified Data Processing on Large Clusters :Error 404 (Not Found)!!1
- 徒然な忘備録。 :ぽっかり日誌ぽっかり日誌
- グーグルデータセンターの内側–明らかにされた独自性 – page2 – builder by ZDNet Japan :http://builder.japan.zdnet.com/news/story/0,3800079086,20374847-2,00.htm
- Google spotlights data center inner workings | Tech news blog – CNET News.com :301 Moved Permanently
- アリエル エリア – ドキュメント-Google File System(GFS)技術メモ :原稿・資料 — ありえるえりあ
- Perl Tips | Google File System (GFS) とは(GFS の論文) :Perl Tips | Google File System (GFS) とは(GFS の論文)
- 巨大な検索システムを耐障害性の高いソフトと安価なマシンで実現 :巨大な検索システムを耐障害性の高いソフトと安価なマシンで実現
oldId.20080707033613550