Webエンジニアの開発記

Webエンジニアの開発記録です。Java,SAStruts,jQuery,AmazonWebService,マッシュアップ。

AWS(Amazon Web Service)で定時バッチを起動する方法 の調査

私は日頃はフツーの業務アプリのPGです。

まだバッチの作成業務にあたったことはありません。

 

ですが、バッチって便利だと思うんですよね。

例えば、WEBを自動でクロールしてAタグを拾って、

href属性の中身=URLをどんどんため込んでいく。

これがプログラム1。

 

プログラム2は、プログラム1がため込んだURLを取得して、

内容を解析して役立つデータに加工する。

 

プログラム2をバッチで毎日1回なり2回なり、

起動できるようになればいいですよね。

 

AWSに設置するにはどうすればよいのでしょうか?

「aws バッチ」で検索してみた。

 

■ アマゾン公式サイト

・バッチ処理PDF

http://d36cz9buwru1tt.cloudfront.net/jp/architecturecenter/RefArch_BatchProcessing_5Ar.pdf

よーく読まないと意味が分かりません。

 

■一般の方のサイト

[AWS Summit 2012] クラウドデザインパターン#5 CDP バッチ処理編

レベルが高い。

今はパターンよりも、どのサービスを使って、

どうやって動かすかを知りたい。

30Pに「SQSを使う」とある。

36Pに「シンプルな並列処理はSQSのみで実装するのが楽」とある。

 

Amazon Web Services ブログ: 【AWS発表】Amazon SQSに新機能が追加! ロングポーリング、リクエストバッチ処理/クライアントサイドでのバッファリング

やはりSQSが出てきた。

Simple Queue Service (=SQS)のことらしい。

バッチオペレーション、遅延キュー、 タイマー、 AWS Management Console のサポート, CloudWatchメトリクス が使えるらしい。

バッチオペレーションやタイマーは関係ありそう。

 

明日はSQSについて調べてみよう。