Hippo notes

博文

目前显示的是三月, 2011的博文

如何让100台计算机同时为你计算同一道算术题？——分布式计算Hadoop配置及实践（一）

假如你有一个比较复杂的算术题，用1台普通计算机需要计算3个月才能出结果，有什么办法可以让它能在1天内出结果呢？比较“廉价”的方式可能是用100台普通计算机搭建一台“超级计算机”，让100台计算机同时计算，那么理论上1天就可以完成。 Apache Hadoop 是一个分布式计算框架，你只需要定义如何将一个计算任务拆分（Map）以及如何将各个分任务的结果合并（Reduce），剩下的事情比如如何协调100台计算机一起工作，如何保证即使某一台计算机中途坏掉了也不会影响整个工作等，都由 Hadoop 帮你代劳。Hadoop 同时也是一个分布式的基础架构，在其基础上有： HDFS 分布式储存 HBase 分布式NoSQL数据库 Nutch 分布式全文搜索等等一大堆重量级产品，这些都是构建一个大型应用所必须的基础设施。@ivarptr 这里我简单介绍基本的 Hadoop 系统的搭建方法，Hadoop 在运行时由5个程序组成： 1个NameNode，用于管理命名空间以及客户端对文件的访问； 1个JobTracker，用于调度工作以及分配任务（Task）； 1个SecondaryNameNode，用于辅助NameNode的工作； 1～N个DataNode 用于数据储存； 1～N个TaskTracker 用于执行任务，DataNode 和 TaskTracker 总是在同一台计算机里运行。前3个程序一般是分别在三台不同的计算机里运行，为了简单起见下面的例子我会在同一台计算机里运行这3个程序，然后再另外找3台计算机运行DataNode（连同TaskTracker），一共需要4台计算机。结构图如下：下面是详细的搭建过程 1、下载 Apache Hadoop 到这里 http://hadoop.apache.org/ 下载 HDFS，我使用的版本是 0.20.2，下载回来的一个压缩包就已经包含了上面提到的5个程序。 2、配置 Hadoop 虽然在一个典型的 Hadoop 系统里会有 4种不同角色的计算机，不过我们为了简单起见可以先在某一台计算机编辑好配置文件，然后再分发到其他计算机，这样可以避免一台台地配置浪费时间。 a、编辑 conf/hadoop-env...

阅读全文

使用 Sendmail 在 CentOS 5.5 架设邮件服务器

假如你要架设一个有会员管理的网站，可能会遇到诸如“我忘记密码了”、“你有一年没来过了，有空过来瞧瞧吧”这类的问题，一般这类问题都是使用邮件解决的，比如发送一个重置密码的链接或者发送一封提醒邮件。发送邮件的方法有很多，比如使用外面专业SMTP中继服务（一般收费惊人）、使用类似 Google Apps (Free) 的免费邮件发送服务（限制比较多，比如一天不能超过500封等），而比较廉价且彻底的解决方法应该是在自己的服务器上搭建邮件服务器（SMTP服务器）。假如你使用的是 Linux 系统，那么一般邮件服务器早已安装好了，比如 CentOS（RedHat、Fedora等）内置的 Sendmail 服务程序，你只需设置几下即可使用。 1、域名的设置首先你要设置域名DNS的MX记录和SPF记录，一般我们只要有如下几条DNS记录就可以了：记录类型主机名目标 ------------------------------------ A @ 123.123.123.123 （这里应该是你的服务器IP） CNAME www your-domain.com CNAME SMTP your-domain.com MX @ smtp.your-domain.com TXT @ v=spf1 a mx ~all MX记录是邮件服务器必须依赖的，而TXT（SPF）是用来防止自己的邮件服务器发送的邮件不...

阅读全文

为 Tomcat 增加 GoDaddy SSL 证书

为了信息安全，一般网站的用户注册和登录过程会使用加密的 HTTP（即HTTPS）传输用户的帐号和密码，这样可以防止“中间人”盗取帐号资料。假如你的网站是用 Tomcat 直接搭建的，那么主要需要如下几个步骤： 1、购买 SSL 证书。 2、在你的服务器上生成一个私密钥匙（Private Key）。 3、在 SSL 证书销售商那里签名你的 Key。 4、将最终生成的认证证书导入 Tomcat KeyStore 5、修改 Tomcat 的配置。下面详细讲解。 1、购买 SSL 证书为网站添加 HTTPS 功能第一步需要购买一个SSL认证证书，目前使用比较广泛的有： VeriSign 典型客户有 Microsoft Hotmail Thawte 典型客户有 Google Gmail 不过这些品牌的证书价格不菲，假如你的网站只是想提供加密传输的话，可以购买 GoDaddy 的廉价SSL证书，目前报价是 $49.99/年，不过你可以通过推销链接以 $12.99/年买到，比如这个推销链接： http://www.godaddy.com/ssl/ssl-certificates.aspx?isc=IAPtssl1 2、生成私密钥匙使用OpenSSL工具可以很容易生成私钥，不过由于我们准备给Tomcat使用，所以直接使用keytool更为方便。转到 Tomcat 的安装目录，运行 $keytool -keysize 2048 -genkey -alias tomcat -keyalg RSA -keystore tomcat.keystore 然后它会提示你设置一个密码，使用Tomcat常用的“changeit”即可，然后根据提示输入DN信息：输入keystore密码：changeit 再次输入新密码: changeit 您的名字与姓氏是什么？ [Unknown]： yourdomain.com 您的组织单位名称是什么？ [Unknown]： Networking 您的组织名称是什么？ [Unknown]： yourdomain.com 您所在的城市或区域名称是什么？...

阅读全文

使用 Jetty 7 搭建虚拟主机

同 Tomcat 一样，Jetty 也是纯 Java 的 Web 服务器和 Servlet 容器。跟 Tomcat 不同的是 Jetty 本身模块化机制，最基本模块的只负责网络 IO 和 HTTP 协议，所以程序运行效率非常高。很多程序都会嵌入 Jetty 以提供 HTTP 服务，比如一些提供 HTTP 接口的 NoSQL、分布式文件系统和全文索引引擎等产品，还有 Google 的 App Engine （java版）也使用 Jetty 提供 Web 服务，另外 Jetty 的 Comet 特性经常用于实现实时数据通信。除此以外，Jetty 也能够以 Standalone 形式运行，可以很轻巧地实现搭建多（Java web application）站点服务。下面以在一台服务器（只有一个公网IP地址）上搭建 abc.com，xyz.com 作为例子讲解搭建及配置过程。 1、下载 Jetty 7 Jetty 7 的各个部分包括：Core Web Server (HTTP & Websocket)，Core Servlet Container，JNDI, JMX, OSGi, JASPI modules 都是单独提供，所以为了简单起见，可以下载一个整合包： JETTY_VERSION=7.0.2.v20100331 wget http://download.eclipse.org/jetty/$JETTY_VERSION/dist/jetty-distribution-$JETTY_VERSION.tar.gz tar xfz jetty-distribution-$JETTY_VERSION.tar.gz cd jetty-distribution-$JETTY_VERSION java -jar start.jar 这样你就已经完成下载和运行 Jetty 了，试试访问 http://localhost:8080/。 2、Jetty 的配置 Jetty 的主目录里有几个比较重要的目录： contexts 存放各个 web app 的配置文件 contexts-avaiable 存放各个暂时不使用的 web app （一般是自带的示例）的配置文件 etc jetty程序本身的配置文件 webapps 存放各个 web app ...

阅读全文