Êý¾Ý·Ö²¼Ê½´æ´¢
3.1 ½ÌÑ§Ä¿±ê
1. ÄÜÁ¦Ä¿±ê 
(1)ÄÜ¹»¸ù¾ÝÏîÄ¿Êµ¼Ê,Ç¡µ±Ñ¡ÓÃHadoop¡¢CephºÍHBase²úÆ·¡£
(2)ÄÜ¹»¸ù¾Ý¹¤³ÌÊµ¼Ê,»ùÓÚHadoop¡¢CephºÍHBaseÉè¼Æ´æ´¢ÏµÍ³¡£
(3)ÄÜ¹»»ùÓÚÏîÄ¿ÐèÇó,¿ª·¢·ÃÎÊHadoop¡¢CephºÍHBase´æ´¢ÏµÍ³µÄÓ¦ÓÃ³ÌÐò¡£
(4)ÄÜ¹»»ùÓÚÏÖÓÐ´æ´¢ÏµÍ³µÄÏÞÖÆ,½øÐÐ×î´óÏÞ¶ÈµÄÊý¾Ý·Ö²¼Ê½´æ´¢·½°¸µÄ¸Ä½ø¡£
2. ËØÖÊÄ¿±ê
(1)ÄÜ¹»×¼È·×«Ð´Hadoop¡¢CephºÍHBase´æ´¢ÏµÍ³µÄÉè¼ÆÎÄµµ¡£
(2)ÄÜ¹»ÏèÊµ×«Ð´Hadoop¡¢CephºÍHBase´æ´¢ÏµÍ³µÄ´î½¨ÎÄµµ¡£
3.2 Hadoop ·Ö²¼Ê½´æ´¢
3.2.1 Hadoop3.1.1Î±·Ö²¼Ê½¼¯Èº»·¾³´î½¨
1. ÉèÖÃ»ù´¡»·¾³ 
ÒÔrootÉí·Ý·Ö±ðÔÚ3Ì¨¼ÆËã»úÉÏ,±à¼­ÍøÂçÅäÖÃÎÄ¼þ,ÉèÖÃÖ÷»úÃû³Æ,Ö´ÐÐÈçÏÂµÄÃüÁî¡£ 
#vim /etc/sysconfig/network 
´ò¿ªÎÄ¼þºó,½«Ãû×Ö½ÚµãµÄhostname¸ÄÎªmaster,½«2¸öÊý¾Ý½ÚµãµÄhostname¸Ä
Îªslave1ºÍslave2,½«ËùÓÐ½ÚµãµÄnetworkingÉèÖÃÎªyes¡£
È»ºó,ÔÚÖ÷½ÚµãÉèÖÃÖ÷»úÃû,Ö´ÐÐÈçÏÂµÄÃüÁî¡£ 
#hostnamectl set-hostname master 
ÀàËÆµØ,ÔÚ2¸öÊý¾Ý½ÚµãÉèÖÃÖ÷»úÃû,·Ö±ðÖ´ÐÐÈçÏÂµÄÃüÁî¡£ 
#hostnamectl set-hostname slave1 
#hostnamectl set-hostname slave2 
3

34 
×îºó,·Ö±ðÔÚ3Ì¨»úÆ÷ÉÏÖ´ÐÐsuÃüÁî,ÒÔÊ¹Ö÷»úÃûÉúÐ§¡£
2. Ìí¼ÓÈ«²¿½ÚµãIP ÓëÖ÷»úÃûµÄÓ³Éä
ÏÈ»ñÈ¡¹ÜÀíÔ±È¨ÏÞ(Ä¬ÈÏºóÃæµÄÃüÁî¶¼ÒÑ»ñÈ¡¸ÃÈ¨ÏÞ),Ö´ÐÐÈçÏÂµÄÃüÁî¡£ 
#sudo su 
½Ó×ÅÐÞ¸ÄÖ÷»úÃûÓ³ÉäÎÄ¼þ,ÒÔÉèÖÃIPµØÖ·ºÍ»úÆ÷Ãû³ÆµÄ¶ÔÓ¦¹ØÏµ,±à¼­Ö÷»úÃûÓ³Éä
ÎÄ¼þ,Ö´ÐÐÈçÏÂµÄÃüÁî¡£ 
#vi /etc/hosts 
´ò¿ªÎÄ¼þºó,ÔÚÄ©Î²×·¼Ómaster¡¢slave1ºÍslave2ÓëIPµØÖ·µÄ¶ÔÓ¦¹ØÏµ,ÈçÏÂËùÊ¾¡£ 
192.168.50.194 master 
192.168.50.190 slave1 
192.168.50.191 slave2 
ÉÏÃæµÄÓ³Éä±íÃ÷Ö÷½ÚµãµÄÖ÷»úÃûÎªmaster,2¸öÊý¾Ý½ÚµãµÄÖ÷»úÃû·Ö±ðÎªslave1ºÍ
slave2¡£
3. ÔÚ3 Ì¨»úÆ÷ÉÏ°²×°JDK 
Hadoop3.1.1ÐèÒª°²×°jdk-8u181-linux-x64.rpm¡£Ê×ÏÈ²é¿´°æ±¾ÊÇ·ñÂú×ãÐèÇó,Èç
¹û²»Âú×ã,ÔòÓ¦ÏÈÐ¶ÔØ,ÔÙ°²×°jdk-8u181-linux-x64.rpm¡£
(1)¼ìÑéÏµÍ³Ô­°æ±¾,Ö´ÐÐÈçÏÂµÄÃüÁî¡£ 
#java -version 
½øÒ»²½²é¿´JDKÐÅÏ¢,Ö´ÐÐÈçÏÂµÄÃüÁî¡£ 
#rpm -qa | grep java 
(2)Ð¶ÔØOpenJDK,Ö´ÐÐÈçÏÂµÄÃüÁî¡£ 
#rpm -e --nodeps java-1.8.0-openjdk-1.8.0.131-11.b12.el7.x86_64 
#rpm -e --nodeps nuxwdog-client-java-1.0.3-5.el7.x86_64 
#rpm -e --nodeps javassist-3.26.1-10.el7.noarch 
#rpm -e --nodeps pki-base-java-10.4.1-10.el7.noarch 
#rpm -e --nodeps tzdata-java-2017b-1.el7.noarch 
#rpm -e --nodeps python-javapackages-3.5.1-11.el7.noarch 
#rpm -e --nodeps javamail-1.4.6-8.el7.noarch 
#rpm -e --nodeps javapackages-tools-3.5.1-11.el7.noarch 
#rpm -e --nodeps java-1.8.0-openjdk-headless-1.8.0.131-11.b12.el7.x86_64 
(3)°²×°JDK¡£
ÔÚOracle¹ÙÍøÏÂÔØjdk-8u181-linux-x64.rpm µ½Windows×ÀÃæ»·¾³ÖÐ,ÓÃWinSCP 
Èí¼þ½«jdk-8u181-linux-x64.rpm ÉÏ´«µ½3Ì¨ÐéÄâ»úµÄ/usr/local/Ä¿Â¼ÏÂ,ÈçÍ¼3-1ËùÊ¾¡£

35 
Í¼3-1 ÓÃWinSCP°ÑJDK°ü´ÓËÞÖ÷»ú¸´ÖÆµ½ÐéÄâ»ú
È»ºó,·Ö±ðÔÚ3Ì¨ÐéÄâ»úÖÐÖ´ÐÐÒÔÏÂµÄÃüÁî¡£ 
#cd /usr/local 
#rpm -ivh jdk-8u181-linux-x64.rpm 
°²×°³É¹¦ºó,JDKÄ¬ÈÏ°²×°ÔÚ/usr/javaÖÐ¡£²é¿´°²×°ÊÇ·ñ³É¹¦,Ö´ÐÐÒÔÏÂµÄÃüÁî¡£ 
#java -version 
(4)ÅäÖÃ»·¾³±äÁ¿¡£
LinuxÊÇÒ»¸ö¶àÓÃ»§µÄ²Ù×÷ÏµÍ³¡£Ã¿¸öÓÃ»§µÇÂ¼ÏµÍ³ºó,¶¼ÓÐÒ»¸ö×¨ÓÃµÄÔËÐÐ»·¾³¡£
Í¨³£Ã¿¸öÓÃ»§Ä¬ÈÏµÄ»·¾³¶¼ÊÇÏàÍ¬µÄ,Õâ¸öÄ¬ÈÏ»·¾³Êµ¼ÊÉÏÓÉÒ»×é»·¾³±äÁ¿Ëù¶¨Òå¡£ÓÃ
»§¿ÉÒÔ¶Ô×Ô¼ºµÄÔËÐÐ»·¾³½øÐÐ¶¨ÖÆ,Æä·½·¨ÊÇÐÞ¸ÄÏàÓ¦µÄÏµÍ³»·¾³±äÁ¿¡£³£ÔÚ/etc/ 
profileÎÄ¼þÖÐÐÞ¸Ä»·¾³±äÁ¿,±¾ÊéÖÐ¶Ô»·¾³±äÁ¿µÄÐÞ¸Ä¶ÔËùÓÐÓÃ»§¶¼Æð×÷ÓÃ¡£
ÔÚHadoop¼¯ÈºµÄ3Ì¨ÐéÄâ»úÉÏÐÞ¸ÄÏµÍ³»·¾³±äÁ¿ÎÄ¼þ,Ö´ÐÐÈçÏÂµÄÃüÁî¡£ 
#vi /etc/profile 
´ò¿ªprofileÎÄ¼þºó,ÏòÎÄ¼þÄ©Î²×·¼ÓÒÔÏÂÄÚÈÝ¡£ 
JAVA_HOME=/usr/java/jdk1.8.0_181-amd64 
JRE_HOME=/usr/java/jdk1.8.0_181-amd64/jre 
PATH=$PATH:$JAVA_HOME/bin:$JRE_HOME/bin 
CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar:$JRE_HOME/lib 
±£´æÎÄ¼þºó,ÎªÊ¹µÃÐÞ¸ÄÉúÐ§,Ö´ÐÐÈçÏÂµÄÃüÁî¡£ 
#source /etc/profile

36 
ÎªÁËÑéÖ¤Êä³ö¹¤×÷Ä¿Â¼ÊÇ·ñÕýÈ·,Ö´ÐÐÈçÏÂµÄÃüÁî¡£ 
#echo $PATH 
ÎªÃ¿Ò»¸öÔËÐÐbashshellµÄÓÃ»§Ö´ÐÐ´ËÎÄ¼þ¡£µ±bashshell±»´ò¿ªÊ±,¸ÃÎÄ¼þ±»¶Á
È¡¡£ÐÞ¸Ä.bashrcÎÄ¼þ,Ö´ÐÐÒÔÏÂµÄÃüÁî¡£ 
#vim ~/.bashrc 
´ò¿ªÎÄ¼þºó,ÏòÎÄ¼þÄ©Î²×·¼ÓÈçÏÂµÄÄÚÈÝ¡£ 
export JAVA_HOME=/usr/java/jdk1.8.0_181-amd64 
export JRE_HOME=$JAVA_HOME/jre 
export CLASSPATH=.:$CLASSPATH:$JAVA_HOME/lib:$JRE_HOME/lib 
export PATH=$PATH:$JAVA_HOME/bin:$JRE_HOME/bin 
±£´æºóÍË³ö,ÎªÊ¹ÐÞ¸ÄÉúÐ§,Ö´ÐÐÈçÏÂµÄÃüÁî¡£ 
#source ~/.bashrc 
ÎªÑéÖ¤Êä³ö¹¤×÷Ä¿Â¼ÊÇ·ñÕýÈ·,Ö´ÐÐÈçÏÂµÄÃüÁî¡£ 
#echo $JAVA_HOME 
4. SSH ÉèÖÃÃâÃÜµÇÂ¼
ÉèÖÃ×ÔÉíÃâÃÜµÇÂ¼,Ö´ÐÐÈçÏÂµÄÃüÁî¡£ 
#yum install openssh-server 
ÈôÉÏÃæµÄ°²×°ÌáÊ¾²»³É¹¦,ÐèÒªÏÈ´´½¨Ò»¸öÄ¿Â¼¡£
(1)ÔÚ3¸ö½ÚµãÒÀ´ÎÖ´ÐÐÈçÏÂµÄÃüÁî¡£ 
#cd ~/.ssh/ 
#rm -rf * 
#ssh-keygen -t rsa 
(2)ÔÚ±¾»ú½øÐÐÃâÃÜµÇÂ¼²âÊÔ,Ö´ÐÐÈçÏÂµÄÃüÁî¡£ 
#ssh master //ÔÚmaster ÉÏÖ´ÐÐ
#ssh slave1 //ÔÚslave1 ÉÏÖ´ÐÐ
#ssh slave2 //ÔÚslave2 ÉÏÖ´ÐÐ
(3)´«ËÍÃâÃÜµÇÂ¼ÃÜÔ¿µ½ÆäËû½Úµã,Ê¹µÃ½Úµã¼äÃâÃÜµÇÂ¼¡£
ÔÚmaster½ÚµãÖ´ÐÐÈçÏÂµÄÃüÁî¡£ 
cd ~/.ssh/ 
mv id_rsa.pub id_rsa_189.pub 
scp id_rsa_189.pub slave1:~/.ssh/ 
scp id_rsa_189.pub slave2:~/.ssh/

37 
ÔÚslave1½ÚµãÖ´ÐÐÈçÏÂµÄÃüÁî¡£ 
cd ~/.ssh/ 
mv id_rsa.pub id_rsa_190.pub 
scp id_rsa_190.pub master:~/.ssh/ 
scp id_rsa_190.pub slave2:~/.ssh/ 
ÔÚslave2½ÚµãÖ´ÐÐÈçÏÂµÄÃüÁî¡£ 
cd ~/.ssh/ 
mv id_rsa.pub id_rsa_191.pub 
scp id_rsa_191.pub master:~/.ssh/ 
scp id_rsa_191.pub slave1:~/.ssh/ 
ÔÚ3¸ö½ÚµãÖ´ÐÐÈçÏÂµÄÃüÁî¡£ 
cat id_rsa_189.pub >>authorized_keys 
cat id_rsa_190.pub >>authorized_keys 
cat id_rsa_191.pub >>authorized_keys 
(4)ÔÚmaster½ÚµãµÇÂ¼ÆäËû2¸ö½Úµã,Ö´ÐÐÈçÏÂµÄÃüÁî¡£ 
#ssh slave1 
#exit 
#ssh slave2 
#exit 
ÉÏÃæmaster½Úµã·Ö±ðÃâÃÜµÇÂ¼slave1ºÍslave2½Úµã½øÐÐ²âÊÔ,Ö´ÐÐexitÖ¸ÁîÍË³ö
ÏàÓ¦µÄÊý¾Ý½Úµã¡£
(5)ÔÚslave1ºÍslave2½ÚµãµÇÂ¼master½Úµã,Ö´ÐÐÈçÏÂµÄÃüÁî¡£ 
#ssh master 
²âÊÔ³É¹¦ºóÖ´ÐÐexitÖ¸ÁîÍË³ömaster½ÚµãµÇÂ¼¡£
5. ÔÚ3 ¸ö½Úµã°²×°Hadoop 
ÔÚHadoop¹ÙÍøÏÂÔØHadoop3.1.1,Ñ¡Ôñbinary¸ñÊ½,ÎÄ¼þÎªhadoop-3.1.1.tar.gz,ÔÚ
Windows×ÀÃæ»·¾³ÖÐÊ¹ÓÃWinSCP½«ÆäÉÏ´«µ½Ã¿¸öÐéÄâ»ú½ÚµãµÄ/usr/local/ºó,Ö´ÐÐÈç
ÏÂµÄÃüÁî¡£ 
#cd /usr/local 
#tar -zxvf /usr/local/hadoop-3.1.1.tar.gz -C /usr/local 
#cd /usr/local 
#mv ./hadoop-3.1.1 ./hadoop #½«ÎÄ¼þ¼ÐÃû¸ÄÎªhadoop 
ÔÚÏµÍ³»·¾³ÅäÖÃÎÄ¼þÖÐÌí¼ÓHadoopÏà¹Ø»·¾³,¼´ÔÚ~/.bashrcÎÄ¼þµÄJAVA_ 
HOMEÄ©Î²×·¼Ó,´ò¿ªÎÄ¼þ,Ö´ÐÐÈçÏÂµÄÃüÁî¡£

38 
#vim ~/.bashrc 
´ò¿ªÎÄ¼þºó,ÏÂÔØ3-3-1-5-Hadoop°²×°bashrcÎÄ¼þ,¸üÐÂµ±Ç°.bashrcÄÚÈÝ¡£Í¬ÑùÐè
ÒªÖ´ÐÐsource~/.bashrc,ÒÔÊ¹ÐÞ¸ÄÉúÐ§,ÔÙÖ´ÐÐHDFS¹Û²ìÊÇ·ñ³öÏÖÃüÁî°ïÖúÌáÊ¾,Ö´
ÐÐÈçÏÂµÄÃüÁî¡£ 
#source ~/.bashrc 
#hdfs 
6. Hadoop ÅäÖÃ
Ê×ÏÈ,ÔÚmaster½ÚµãÅäÖÃ/usr/local/hadoop/etc/hadoop/ÏÂµÄ6 ¸öÏà¹ØÅäÖÃÎÄ¼þ
hadoop-env.sh¡¢core-site.xml¡¢hdfs-site.xml¡¢yarn-site.xml¡¢mapred-site.xml¡¢workers¡£
(1)ÐÞ¸Ähadoop-env.sh,ÅäÖÃHadoopÔËÐÐÖÐÊ¹ÓÃµÄ±äÁ¿,Ö´ÐÐÈçÏÂµÄÃüÁî¡£ 
#cd /usr/local/hadoop/etc/hadoop/ 
#vim hadoop-env.sh 
´ò¿ªÎÄ¼þºó,ÏÂÔØ3-3-1-6-HadoopÅäÖÃenvÎÄ¼þ,¸üÐÂµ±Ç°hadoop-env.shÄÚÈÝ¡£
(2)ÐÞ¸Äcore-site.xmlÎÄ¼þ,ÅäÖÃÎÄ¼þÏµÍ³,Ö´ÐÐÈçÏÂµÄÃüÁî¡£ 
#vim core-site.xml 
´ò¿ªÎÄ¼þºó,ÏÂÔØ3-3-1-6-HadoopÅäÖÃcore-siteÎÄ¼þ,¸üÐÂµ±Ç°core-site.xmlÄÚÈÝ¡£
(3)ÐÞ¸Ähdfs-site.xmlÎÄ¼þ,ÅäÖÃÎÄ¼þÏµÍ³ºÍÏà¹ØÐ­ÒéµÄ·ÃÎÊµØÖ·,Ö´ÐÐÈçÏÂµÄ
ÃüÁî¡£ 
#vim hdfs-site.xml 
´ò¿ªÎÄ¼þºó,ÏÂÔØ3-3-1-6-Hadoop ÅäÖÃhdfs-siteÎÄ¼þ,¸üÐÂµ±Ç°hdfs-site.xml 
ÄÚÈÝ¡£
(4)ÐÞ¸Äyarn-site.xml,ÅäÖÃYARN ×ÊÔ´¹ÜÀíÆ÷µÄÓÐ¹Ø²ÎÊý,Ö´ÐÐÈçÏÂµÄÃüÁî¡£ 
#vim yarn-site.xml 
´ò¿ªÎÄ¼þºó,ÏÂÔØ3-3-1-6-HadoopÅäÖÃyarn-siteÎÄ¼þ,¸üÐÂµ±Ç°yarn-site.xmlÄÚÈÝ¡£
(5)ÐÞ¸Ämapred-site.xml,ÅäÖÃMapReduceµÄÓÐ¹Ø²ÎÊý,Ö´ÐÐÈçÏÂµÄÃüÁî¡£ 
#vim mapred-site.xml 
´ò¿ªÎÄ¼þºó,ÏÂÔØ3-3-1-6-HadoopÅäÖÃmapred-siteÎÄ¼þ,¸üÐÂµ±Ç°mapred-site.xml 
ÄÚÈÝ¡£
(6)ÐÞ¸Äworkers,ÉèÖÃÊý¾Ý½Úµã,Ö´ÐÐÈçÏÂµÄÃüÁî¡£ 
#vim workers 
´ò¿ªÎÄ¼þºó,ÏòÎÄ¼þÄ©Î²×·¼ÓÈçÏÂµÄÅäÖÃ¡£ 
slave1 
slave2

39 
(7)±£Ö¤3¸ö½ÚµãÅäÖÃÒ»ÖÂ,½«master½ÚµãµÄÅäÖÃÎÄ¼þ¸´ÖÆµ½¼¯ÈºÆäËû½Úµã,ÔÚ
master»úÆ÷ÉÏÖ´ÐÐÈçÏÂµÄÃüÁî¡£ 
#scp hadoop-env.sh root@slave1:/usr/local/hadoop/etc/hadoop/ 
#scp core-site.xml root@slave1:/usr/local/hadoop/etc/hadoop/ 
#scp hdfs-site.xml root@slave1:/usr/local/hadoop/etc/hadoop/ 
#scp mapred-site.xml root@slave1:/usr/local/hadoop/etc/hadoop/ 
#scp yarn-site.xml root@slave1:/usr/local/hadoop/etc/hadoop/ 
#scp workers root@slave1:/usr/local/hadoop/etc/hadoop/ 
#scp hadoop-env.sh root@slave2:/usr/local/hadoop/etc/hadoop/ 
#scp core-site.xml root@slave2:/usr/local/hadoop/etc/hadoop/ 
#scp hdfs-site.xml root@slave2:/usr/local/hadoop/etc/hadoop/ 
#scp mapred-site.xml root@slave2:/usr/local/hadoop/etc/hadoop/ 
#scp yarn-site.xml root@slave2:/usr/local/hadoop/etc/hadoop/ 
#scp workers root@slave2:/usr/local/hadoop/etc/hadoop/ 
(8)ÔÚ3¸ö½ÚµãÉÏ·Ö±ð´´½¨HadoopÅäÖÃ¶ÔÓ¦µÄÄ¿Â¼,Ö´ÐÐÈçÏÂµÄÃüÁî¡£ 
mkdir /usr/hadoop 
mkdir /usr/hadoop/tmp 
mkdir /usr/local/hadoop/hdfs 
mkdir /usr/local/hadoop/hdfs/name 
mkdir /usr/local/hadoop/hdfs/data 
7. Æô¶¯Hadoop 
(1)¸ñÊ½»¯namenode¡£
µÚÒ»´ÎÆô¶¯ÐèÔÚmaster½Úµã½øÐÐ¸ñÊ½»¯²Ù×÷,Ö´ÐÐÈçÏÂµÄÃüÁî¡£ 
#hdfs namenode -format 
Èç¹ûÌáÊ¾ÐÅÏ¢ÖÐ³öÏÖ¡°/usr/local/hadoop/hdfs/name has been successfully 
formatted.¡±,±íÊ¾¸ñÊ½»¯³É¹¦¡£
(2)Æô¶¯¼¯Èº·þÎñ¡£
ÔÚmaster½ÚµãÆô¶¯¼¯Èº,Ö´ÐÐÈçÏÂµÄÃüÁî¡£ 
#cd /usr/local/hadoop 
#sbin/start-all.sh 
ÑéÖ¤¼¯ÈºÆô¶¯ÊÇ·ñ³É¹¦,ÔÚ3 ¸ö½Úµã·Ö±ðÖ´ÐÐjps,²é¿´Æô¶¯·þÎñÇé¿ö¡£Ê×ÏÈÔÚ
master½ÚµãÖ´ÐÐjpsÃüÁî¡£
ÏÔÊ¾½á¹ûÈçÏÂ¡£ 
13780 NameNode 
14443 ResourceManager 
14875 Jps

40 
14175 SecondaryNameNode 
³öÏÖÉÏÃæ4¸ö·þÎñ½ø³ÌÐÅÏ¢±íÊ¾master½Úµã×÷ÎªÃû×Ö½Úµã¡¢×ÊÔ´¹ÜÀíÆ÷¡¢±¸ÓÃÃû×Ö
½ÚµãÆô¶¯³É¹¦¡£
ÔÚslave1½ÚµãÉÏÖ´ÐÐjpsÃüÁî,ÏÔÊ¾½á¹ûÈçÏÂ¡£ 
13880 NodeManager 
14202 Jps 
13755 DataNode 
³öÏÖÉÏÃæ3¸ö·þÎñ½ø³ÌÐÅÏ¢±íÊ¾slave1½Úµã×÷ÎªÊý¾Ý½Úµã¡¢½Úµã¹ÜÀíÆ÷Æô¶¯³É¹¦¡£
ÔÚslave2½ÚµãÉÏÖ´ÐÐjps,Óëslave1½ÚµãÀàËÆ,²»ÔÙÀÛÊö¡£
8. ÓÃWeb ä¯ÀÀÆ÷²é¿´¼¯Èº·þÎñ
ÔÚä¯ÀÀÆ÷ÖÐ·ÃÎÊmaster:50070,Hadoop¼¯ÈºµÄ¸ÅÀÀÈçÍ¼3-2ËùÊ¾,Hadoop¼¯ÈºÐÅ
Ï¢ÈçÍ¼3-3ËùÊ¾¡£
Í¼3-2 Hadoop¼¯ÈºµÄ¸ÅÀÀ
ÖÁ´Ë,Íê³ÉÕû¸ö°²×°ÒÔ¼°ÅäÖÃ¹ý³Ì¡£
9. ¹Ø±Õ¼¯Èº·þÎñ
ÔÚmaster½ÚµãÉÏÖ´ÐÐÈçÏÂµÄÃüÁî¡£ 
#sbin/stop-all.sh 
10. ÖØÐÂ¸ñÊ½»¯
µ±Æô¶¯HadoopÊ§°Ü»òÕßÊ×´Î¸ñÊ½»¯Ê§°Ü,ÐèÒªÖØÐÂ¸ñÊ½»¯¡£Èç¹ûÖ´ÐÐ¸ñÊ½»¯ºó, 
slave1»òslave2½ÚµãÖÐµÄDatanodeÎÞ·¨Æô¶¯,¿É³¢ÊÔ¹Ø±ÕHadoop¼¯Èº,É¾³ýmaster½Ú
µãÖÐ/usr/local/hadoop/hdfs/name/Ä¿Â¼ÒÔ¼°slave1»òslave2½ÚµãÖÐ/usr/local/hadoop/

41
Í¼3-3 Hadoop¼¯ÈºÊý¾Ý½ÚµãÐÅÏ¢
/Ä¿Â¼ÏÂµÄËùÓÐÎÄ¼þ,ÔÙµ½master½ÚµãÖ´ÐÐ¸ñÊ½»¯,Ê¹NamenodeºÍDatanode 
ID Ò»ÖÂ¡£
11.WordCountÔËÐÐÏê½â
ce±à³ÌÄ£ÐÍ¡£
e²ÉÓÃ¡°·Ö¶øÖÎÖ®¡±µÄË¼Ïë,°Ñ¶Ô´ó¹æÄ£Êý¾Ý¼¯µÄ²Ù×÷,·Ö·¢¸øÒ»¸öÖ÷½Úµã
¹ÜÀíÏÂµÄ¸÷¸öÊý¾Ý½Úµã¹²Í¬Íê³É,È»ºóÍ¨¹ýÕûºÏ¸÷¸öÊý¾Ý½ÚµãµÄÖÐ¼ä½á¹û,µÃµ½×îÖÕ½á
educeÊÇ¡°ÈÎÎñµÄ·Ö½âÓë½á¹ûµÄ»ã×Ü¡±¡£
pÖÐÓÃÓÚÖ´ÐÐMapReduceÈÎÎñµÄ»úÆ÷½ÇÉ«ÓÐÁ½¸ö,Ò»¸öÊÇJobTracker,Áí
er¡£JobTrackerÓÃÓÚµ÷¶È¹¤×÷,TaskTrackerÓÃÓÚÖ´ÐÐ¹¤×÷¡£Ò»¸ö
p¼¯ÈºÖÐÖ»ÓÐÒ»¸öJobTracker¡£
ÔÚ·Ö²¼Ê½¼ÆËãÖÐ,MapReduce¿ò¼Ü¸ºÔð´¦Àí²¢ÐÐ±à³ÌÖÐ·Ö²¼Ê½´æ´¢¡¢¹¤×÷µ÷¶È¡¢¸ºÔØ
ÈÝ´í´¦ÀíÒÔ¼°ÍøÂçÍ¨ÐÅµÈ¸´ÔÓÎÊÌâ,°Ñ´¦Àí¹ý³Ì¸ß¶È³éÏóÎªmap() ºÍ
map() ¸ºÔð°ÑÈÎÎñ·Ö½â³É¶à¸öÈÎÎñ,reduce() ¸ºÔð°Ñ·Ö½âºó¶àÈÎÎñ´¦
eÀ´´¦ÀíµÄÊý¾Ý¼¯(»òÈÎÎñ)±ØÐë¿ÉÒÔ·Ö½â³ÉÐí¶àÐ¡µÄÊý¾Ý¼¯,¶øÇÒËùÓÐ
Ð¡Êý¾Ý¼¯¿ÉÒÔÍêÈ«²¢ÐÐµØ½øÐÐ´¦Àí¡£
hdfs/data
ÖÐµÄCluster

(1)MapRedu

MapReduc

¹û¡£¼ò¶øÑÔÖ®,MapR

ÔÚHadoo
Ò»¸öÊÇTaskTrackHadoo

¾ùºâ¡¢ÈÝ´í¾ùºâ¡¢
reduce() Á½¸öº¯Êý,

ÀíµÄ½á¹û»ã×Ü¡£

ÓÃMapReduc


42 
(2)MapReduce´¦Àí¹ý³Ì¡£
ÈçÍ¼3-4ËùÊ¾,ÔÚHadoopÖÐÃ¿¸öMapReduceÈÎÎñ¶¼±»³õÊ¼»¯ÎªÒ»¸öJob,Ã¿¸öJob 
·ÖÎªmap½×¶ÎºÍreduce½×¶Î¡£ÕâÁ½¸ö½×¶Î·Ö±ðÓÃmap()º¯ÊýºÍreduce()º¯ÊýÀ´ÊµÏÖ¡£
map()º¯Êý½ÓÊÕÒ»¸ö<key,value>ÐÎÊ½µÄÊäÈë,È»ºóÍ¬Ñù²úÉúÒ»¸ö<key,value>ÐÎÊ½µÄ
ÖÐ¼äÊä³ö,reduce()º¯Êý½ÓÊÕÒ»¸öÈç<key,(listofvalues)>ÐÎÊ½µÄÊäÈë,È»ºó¶ÔÕâ¸ö
value¼¯ºÏ½øÐÐ´¦Àí,Ã¿¸öreduce()²úÉú0»ò1¸öÊä³ö,reduce()µÄÊä³öÒ²ÊÇ<key,value> 
ÐÎÊ½¡£
Í¼3-4 MapReduce´¦Àí´óÊý¾ÝµÄ¹ý³Ì
(3)ÔËÐÐWordCount³ÌÐò¡£
µ¥´Ê¼ÆÊýÒÔ×î¼òµ¥µÄÑùÀýÌåÏÖMapReduce Ë¼Ïë,³ÆÎªMapReduce °æµÄHello 
World,¸Ã³ÌÐòµÄÍêÕû´úÂë¿ÉÒÔÔÚHadoop°²×°°üµÄexamplesÄ¿Â¼ÏÂÕÒµ½¡£µ¥´Ê¼ÆÊýµÄ
Ö÷Òª¹¦ÄÜÊÇÍ³¼ÆÄ³ÎÄ±¾ÎÄ¼þÖÐÃ¿¸öµ¥´Ê³öÏÖµÄ´ÎÊý¡£
ÎªÊµÏÖµ¥´Ê¼ÆÊý,ÔÚmaster½ÚµãÖ´ÐÐÈçÏÂµÄÃüÁî¡£ 
#hadoop fs -chmod -R 777 / 
#hadoop fs -mkdir /input 
#hadoop fs -ls / 
#hadoop fs -put LICENSE.txt /input 
# hadoop jar share/hadoop/mapreduce/hadoop - mapreduce - examples - 3. 1. 1. jar 
wordcount /input /output 
²é¿´½á¹ûÎÄ¼þºÍÔËÐÐ½á¹û,Ö´ÐÐÈçÏÂµÄÃüÁî¡£ 
#hadoop fs -ls /output 
ÃüÁîÖ´ÐÐ½á¹ûÏÔÊ¾ÈçÏÂ¡£ 
Found 2 items 
-rw-r--r-- 1 root supergroup 0 2020-11-11 17:02 /output/_SUCCESS 
-rw-r--r-- 1 root supergroup 34795 2020-11-11 17:02 /output/part-r-00000 
ÉÏÃæµÄÊä³öÐÅÏ¢±íÊ¾µ¥´Ê¼ÆÊý³É¹¦²¢´æ´¢ÔÚoutputÄ¿Â¼,²é¿´µ¥´Ê¼ÆÊýÍ³¼Æ½á¹û, 
Ö´ÐÐÈçÏÂµÄÃüÁî¡£

43 
#hadoop fs -cat /output/part-r-00000 
ÃüÁîÖ´ÐÐ½á¹ûÏÔÊ¾ÈçÏÂ¡£ 
...... 
'Your' 2 
'You' 4 
'as 1 
'commercial' 3 
'control' 2 
12. WordCount Ô´Âë·ÖÎö
(1)ÌØ±ðÊý¾ÝÀàÐÍ½éÉÜ¡£
HadoopÌá¹©µÄÊý¾ÝÀàÐÍ¶¼ÊµÏÖÁËWritableComparable½Ó¿Ú,ÒÔ±ãÓÃÕâÐ©ÀàÐÍ¶¨Òå
µÄÊý¾Ý¿ÉÒÔ±»ÐòÁÐ»¯½øÐÐÍøÂç´«ÊäºÍÎÄ¼þ´æ´¢,ÒÔ¼°½øÐÐ´óÐ¡±È½Ï,¾ßÌåÊý¾ÝÀàÐÍÈçÏÂ¡£
BooleanWritable:±ê×¼²¼¶ûÐÍÊýÖµ¡£
ByteWritable:µ¥×Ö½ÚÊýÖµ¡£
DoubleWritable:Ë«×Ö½ÚÊý¡£
FloatWritable:¸¡µãÊý¡£
IntWritable:ÕûÐÍÊý¡£
LongWritable:³¤ÕûÐÍÊý¡£
Text:Ê¹ÓÃUTF8¸ñÊ½´æ´¢µÄÎÄ±¾¡£
NullWritable:µ±<key,value>ÖÐµÄkey»òvalueÎª¿ÕÊ±Ê¹ÓÃ¡£
(2)¸÷½×¶ÎËµÃ÷¡£
.JobConf¾ßÌåÅäÖÃÏîÈçÏÂËùÁÐ¡£
setInputFormat:ÉèÖÃmapµÄÊäÈë¸ñÊ½,Ä¬ÈÏÎªTextInputFormat,keyÎªLongWritable, 
valueÎªText¡£
setNumMapTasks:ÉèÖÃmapÈÎÎñµÄ¸öÊý,´ËÉèÖÃÍ¨³£²»Æð×÷ÓÃ,mapÈÎÎñµÄ¸öÊýÈ¡
¾öÓÚÊäÈëµÄÊý¾ÝËùÄÜ·Ö³ÉµÄinputsplitµÄ¸öÊý¡£
setMapperClass:ÉèÖÃMapper,Ä¬ÈÏÎªIdentityMapper¡£
setMapRunnerClass:ÉèÖÃMapRunner,maptaskÊÇÓÉMapRunnerÔËÐÐµÄ,Ä¬ÈÏÎª
MapRunnable,Æä¹¦ÄÜÎªË³´Î¶ÁÈ¡inputsplitµÄÈ«²¿record,ÒÀ´Îµ÷ÓÃMapperµÄmap() 
º¯Êý¡£
setMapOutputKeyClassºÍsetMapOutputValueClass:ÉèÖÃMapper Êä³ö¶Ôkeyvalue
µÄ¸ñÊ½¡£
setOutputKeyClassºÍsetOutputValueClass:ÉèÖÃReducerÊä³ö¶Ôkey-valueµÄ¸ñÊ½¡£
setPartitionerClassºÍsetNumReduceTasks:ÉèÖÃPartitioner,Ä¬ÈÏÎªHashPartitioner,Æä
¸ù¾ÝkeyµÄHashÖµÀ´¾ö¶¨½øÈëÄÄ¸öpartition,Ã¿¸öpartition±»Ò»¸öReduceTask´¦Àí,ËùÒÔ
partitionµÄ¸öÊýµÈÓÚReduceTaskµÄ¸öÊý¡£
setReducerClass:ÉèÖÃReducer,Ä¬ÈÏÎªIdentityReducer¡£

t¡£
Ò»¸öÂ·¾¶¡¢

bÔËÐÐÇ°´ËÂ·¾¶²»Ó¦

oop»áÍ¨¹ý

leInputFormatµÄ
Ò²¿ÉÒÔÊÇÄ¿Â¼
InputPath()·½·¨¡£

¼´Ð´ÈëÄ¿Â¼¡£ÔËÐÐ×÷Òµ

ap()ºÍreduce() 
educe()º¯ÊýµÄÊä

extInputFormat¡£

inclas 
Îª

ava½ø³Ì,Æä

obÏà¹ØµÄÎÄ¼þ¡£
ubmitJob()º¯Êý¡£
obID ¡¢¼ì²â´ËJob 

b.lÅäÖÃÎÄ¼þºÍ
xm

Ö±µ½ÈÎ

Job 

rogres
¡£ÔÚ´´½¨
nputsplits¡£ÆäÎª

44setOutputFormat:ÉèÖÃÈÎÎñµÄÊä³ö¸ñÊ½,Ä¬ÈÏÎªTextOutputFormaFileInputFormat.addInputPath:ÉèÖÃÊäÈëÎÄ¼þµÄÂ·¾¶(¿ÉÒÔÊÇÒ»¸öÎÄ¼þ¡¢
Ò»¸öÍ¨Åä·û),¿ÉÒÔ±»µ÷ÓÃ¶à´ÎÌí¼Ó¶à¸öÂ·¾¶¡£
FileOutputFormat.setOutputPath:ÉèÖÃÊä³öÎÄ¼þµÄÂ·¾¶,ÔÚJo
¸Ã´æÔÚ¡£
JobConf¶ÔÏóÖÆ¶¨×÷ÒµÖ´ÐÐ¹æ·¶,¹¹Ôìº¯ÊýµÄ²ÎÊýÎª×÷ÒµËùÔÚµÄÀà,Had
¸ÃÀàÀ´²éÕÒ°üº¬¸ÃÀàµÄJARÎÄ¼þ¡£
¹¹ÔìJobConf¶ÔÏóºó,Ö¸¶¨ÊäÈëºÍÊä³öÊý¾ÝµÄÂ·¾¶¡£±¾ÊéÍ¨¹ýFi
¾²Ì¬·½·¨addInputPath()À´¶¨ÒåÊäÈëÊý¾ÝµÄÂ·¾¶,Â·¾¶¿ÉÒÔÊÇµ¥¸öÎÄ¼þ,
(¼´Ä¿Â¼ÏÂµÄËùÓÐÎÄ¼þ)»ò·ûºÏÌØ¶¨Ä£Ê½µÄÒ»×éÎÄ¼þ,¿ÉÒÔ¶à´Îµ÷ÓÃadd
Í¬Àí,FileOutputFormat.setOutputPath()Ö¸¶¨Êä³öÂ·¾¶, 
Ç°,Èç¹ûÐ´ÈëÄ¿Â¼²»Ó¦¸Ã´æÔÚ,Hadoop»á¾Ü¾ø²¢±¨´í¡£ÕâÑùÉè¼ÆÖ÷ÒªÊÇ·ÀÖ¹Êý¾Ý¶ªÊ§, 
ÒòÎªHadoopÔËÐÐÊ±¼ä³¤¡£
FileOutputFormat.setOutputPath()ºÍconf.setMapperClass()Ö¸¶¨m
ÀàÐÍ¡£
½Ó×Å,setOutputKeyClassºÍsetOutputValueClassÖ¸¶¨map()ºÍr
³öÀàÐÍ,ÕâÁ½¸öº¯ÊýµÄÊä³öÀàÐÍÍùÍùÏàÍ¬¡£Èç¹û²»Í¬,map()º¯ÊýµÄÊä³öÀàÐÍÍ¨¹ý
setMapOutputKeyClassºÍsetMapOutputValueClassÖ¸¶¨¡£
ÊäÈëµÄÀàÐÍÓÃInputFormatÉèÖÃ,±¾ÀýÖÐÃ»ÓÐÖ¸¶¨,Ê¹ÓÃÄ¬ÈÏµÄT
×îºóJobClient.runJob()»áÌá½»×÷Òµ²¢µÈ´ýÍê³É,½«½á¹ûÐ´µ½¿ØÖÆÌ¨¡£
.MapReduceµÄ´¦Àí¹ý³ÌÖ÷ÒªÉæ¼°ÒÔÏÂ4¸ö²¿·Ö¡£
¿Í»§¶ËClient:ÓÃÓÚÌá½»MapReduceÈÎÎñJob¡£
JobTracker:Ð­µ÷Õû¸öJobµÄÔËÐÐ¡£ËüÊÇÒ»¸öJava½ø³Ì,ÆämaJobTracker¡£
TaskTracker:ÔËÐÐ´ËJobµÄtask,´¦Àíinputsplit¡£ËüÊÇÒ»¸öJmainclassÎªTaskTracker¡£
HDFS:Hadoop·Ö²¼Ê½ÎÄ¼þÏµÍ³,ÔÚ¸÷¸ö½ø³Ì¼ä¹²ÏíJJobClient.runJob()´´½¨Ò»¸öÐÂµÄJobClientÊµÀý,µ÷ÓÃÆäsJobClientÊµÀýµÄ×÷ÓÃÒÀ´ÎÎªÏòJobTrackerÇëÇóÒ»¸öÐÂµÄJ
µÄoutputÅäÖÃ¡¢¼ÆËã´ËJobµÄinputsplitsºÍ½«JobÔËÐÐËùÐèµÄ×ÊÔ´¸´ÖÆµ½
JobTrackerµÄÎÄ¼þÏµÍ³ÖÐµÄÎÄ¼þ¼ÐÖÐ(°üÀ¨JobJarÎÄ¼þ¡¢joinputsplits)¡¢Í¨ÖªJobTracker´ËJobÒÑ¾­¿ÉÒÔÔËÐÐ¡£
Ìá½»ÈÎÎñºó,runJobÃ¿¸ôÒ»ÃëÖÓÂÖÑ¯Ò»´ÎJobµÄ½ø¶È,½«½ø¶È·µ»Øµ½ÃüÁîÐÐ, 
ÎñÔËÐÐÍê±Ï¡£µ±JobTrackerÊÕµ½submitJobµ÷ÓÃµÄÊ±ºò,½«´ËÈÎÎñ·Åµ½Ò»¸ö¶ÓÁÐÖÐ,
µ÷¶ÈÆ÷½«´Ó¶ÓÁÐÖÐ»ñÈ¡ÈÎÎñ²¢³õÊ¼»¯ÈÎÎñ¡£
³õÊ¼»¯Ê×ÏÈ´´½¨Ò»¸ö¶ÔÏóÀ´·â×°JobÔËÐÐµÄtasks¡¢statusÒÔ¼°ptaskÖ®Ç°,Jobµ÷¶ÈÆ÷Ê×ÏÈ´Ó¹²ÏíÎÄ¼þÏµÍ³ÖÐ»ñµÃJobClient¼ÆËã³öµÄi
Ã¿¸öinputsplit´´½¨Ò»¸ömaptask¡£Ã¿¸ötask±»·ÖÅäÒ»¸öID¡£

TaskTracke
¸æÖªJobTracke
ÔÚJobTracke
¼¶Ñ¡ÔñÒ»¸öJob, 

TaskTracke
¶Ô´ýmaptastaskÖ®¼äÑ¡Ôñ, 

TaskTrackeJacacheÖÐ½«Jo
µÄ¹¤×÷Ä¿Â¼,½«Ja

TaskRunne
Í¨ÐÅÀ´±¨¸æÔËÐÐ½ø¶È¡£

.
µÄmap()
´æmemor

Í¬Ò»¸öpar
ÅÌflus

ma

.ReducJobTracke
Ïµ¡£Reduc
³ö¡£Reducmaptas

½«ËùÓÐµÄmaReduceHDFS ¡£
. 

(3)ÐÂµÄWor
ÏÂÔØ3-3-1-14
Ö´ÐÐµÄ¾ßÌåÊµÏÖ
¡£


45rÖÜÆÚÐÔµØÏòJobTracker·¢ËÍheartbeat¡£ÔÚheartbeatÖÐ,TaskTracker 
rÆäÒÑ¾­×¼±¸ÔËÐÐÒ»¸öÐÂµÄtask,JobTracker½«·ÖÅä¸øÆäÒ»¸ötask¡£
rÎªTaskTrackerÑ¡ÔñÒ»¸ötaskÖ®Ç°,JobTracker±ØÐëÊ×ÏÈ°´ÕÕÓÅÏÈ
ÔÚ×î¸ßÓÅÏÈ¼¶µÄJobÖÐÑ¡ÔñÒ»¸ötask¡£
rÓÐ¹Ì¶¨ÊýÁ¿µÄÎ»ÖÃÀ´ÔËÐÐmaptask»òÕßreducetask¡£Ä¬ÈÏµÄµ÷¶ÈÆ÷
kÓÅÏÈÓÚreducetask¡£µ±Ñ¡ÔñreducetaskµÄÊ±ºò,JobTracker²»ÊÇÔÚ¶à¸ö
¶øÊÇÖ±½ÓÈ¡ÏÂÒ»¸ö,ÒòÎªreducetaskÃ»ÓÐÊý¾Ý±¾µØ»¯µÄ¸ÅÄî¡£
r±»·ÖÅäÁËÒ»¸ötaskºó±ãÔËÐÐ´Ëtask¡£Ê×ÏÈ,TaskTracker½«´ËJobµÄ
r´Ó¹²ÏíÎÄ¼þÏµÍ³ÖÐ¸´ÖÆµ½TaskTrackerµÄÎÄ¼þÏµÍ³ÖÐ¡£TaskTracker´Ódistributed 
bÔËÐÐËùÐèÒªµÄÎÄ¼þ¸´ÖÆµ½±¾µØ´ÅÅÌ¡£Æä´Î,ÆäÎªÃ¿¸ötask´´½¨Ò»¸ö±¾µØ
r½âÑ¹Ëõµ½ÎÄ¼þÄ¿Â¼ÖÐ¡£×îºó,Æä´´½¨Ò»¸öTaskRunnerÀ´ÔËÐÐtask¡£
r´´½¨Ò»¸öÐÂµÄJVMÀ´ÔËÐÐtask¡£±»´´½¨µÄchildJVMºÍTaskTracker 
MapµÄ¹ý³Ì:MapRunnable´ÓÊäÈësplitÖÐÖð¸ö¶ÁÈ¡¼ÇÂ¼,È»ºóÒÀ´Îµ÷ÓÃMapper 
º¯Êý,½«½á¹ûÊä³ö¡£map()µÄÊä³ö²»ÊÇÖ±½ÓÐ´ÈëÓ²ÅÌ,¶øÊÇ½«ÆäÐ´Èë»º
ybuffer¡£µ±bufferÖÐÊý¾Ýµ½´ïÒ»¶¨¹æÄ£,Ò»¸ö±³¾°Ïß³Ì½«Êý¾Ý¿ªÊ¼Ð´
ÈëÓ²ÅÌ¡£ÔÚÐ´ÈëÓ²ÅÌÖ®Ç°,ÄÚ´æÖÐµÄÊý¾ÝÍ¨¹ýpartitioner·Ö³É¶à¸öpartition¡£ÔÚ
titionÖÐ,±³¾°Ïß³Ì»á½«Êý¾Ý°´ÕÕkeyÔÚÄÚ´æÖÐÅÅÐò¡£Ã¿´Î´ÓÄÚ´æÏòÓ²
hÊý¾Ý,¶¼Éú³ÉÒ»¸öÐÂµÄspillÎÄ¼þ¡£µ±´Ëtask½áÊøÖ®Ç°,ËùÓÐµÄspillÎÄ¼þ
±»ºÏ²¢ÎªÒ»¸ö±»·ÖÇø¶øÇÒÅÅºÃÐòµÄÎÄ¼þ¡£Reducer¿ÉÒÔÍ¨¹ýHTTPÐ­ÒéÇëÇó
pµÄÊä³öÎÄ¼þ,tracker.http.threads¿ÉÒÔÉèÖÃHTTP·þÎñÏß³ÌÊý¡£
eµÄ¹ý³Ì:µ±maptask½áÊøºó,ÆäÍ¨ÖªTaskTracker,TaskTrackerÍ¨Öª
r¡£¶ÔÓÚÒ»¸öJob,JobTrackerÖªµÀTaskTracerºÍmapÊä³öµÄ¶ÔÓ¦¹Ø
erÖÐÒ»¸öÏß³ÌÖÜÆÚÐÔµØÏòJobTrackerÇëÇómapÊä³öµÄÎ»ÖÃ,Ö±µ½Æä
È¡µÃÁËËùÓÐµÄmapÊä³ö¡£reducetaskÐèÒªÆä¶ÔÓ¦µÄpartitionµÄËùÓÐµÄmapÊä
etaskÖÐµÄ¸´ÖÆÊÇµ±Ã¿¸ömaptask½áÊøÊ±¿ªÊ¼¸´ÖÆÊä³ö,ÒòÎª²»Í¬µÄ
kÍê³ÉÊ±¼ä²»Í¬¡£ReducetaskÖÐÓÐ¶à¸öcopyÏß³Ì,¿ÉÒÔ²¢ÐÐ¸´ÖÆmap
Êä³ö¡£µ±ºÜ¶àmapÊä³ö¸´ÖÆµ½reducetaskºó,Ò»¸ö±³¾°Ïß³Ì½«ÆäºÏ²¢ÎªÒ»¸ö´ó
µÄÅÅºÃÐòµÄÎÄ¼þ¡£µ±ËùÓÐµÄmapÊä³ö¶¼¸´ÖÆµ½Reducetaskºó,½øÈësort¹ý³Ì, 
pÊä³öºÏ²¢Îª´óµÄÅÅºÃÐòµÄÎÄ¼þ¡£×îºó½øÈëReduce¹ý³Ì,µ÷ÓÃ
rµÄreduce()º¯Êý,´¦ÀíÅÅºÃÐòµÄÊä³öµÄÃ¿¸ökey,×îºóµÄ½á¹ûÐ´Èë
ÈÎÎñ½áÊø:µ±JobTracker»ñµÃ×îºóÒ»¸ötaskµÄÔËÐÐ³É¹¦µÄ±¨¸æºó,½«JobµÄ×´Ì¬
¸ÄÎª³É¹¦¡£µ±JobClient´ÓJobTrackerÂÖÑ¯µÄÊ±ºò,·¢ÏÖ´ËJobÒÑ¾­³É¹¦½áÊø,Ôò
ÏòÓÃ»§´òÓ¡ÏûÏ¢,´ÓrunJob()º¯ÊýÖÐ·µ»Ø¡£
dCount·ÖÎö
MapReduce-WordCountÔ´³ÌÐò¼°·ÖÎöÎÄ¼þ,·ÖÎömap¡¢reduceºÍÈÎÎñ

13. 
WordCount 
´¦Àí¹ý³Ì
WordCountÏêÏ¸µÄÖ´ÐÐ²½ÖèÈçÏÂ¡£

(1)½«ÎÄ¼þ²ð·Ö³Ésplits,²¢½«ÎÄ¼þ°´ÐÐ·Ö¸îÐÎ³É<key,value>¶Ô¡£ÒÔÎÄ¼þÄÚÈÝ
¡°HeloWorldByeWorldHeloHadoopByeHadoop¡±ÎªÀý,ÈçÍ¼3-5ËùÊ¾¡£ÕâÒ»²½ÓÉ
MapReduce¿ò¼Ü×Ô¶¯Íê³É,ÆäÖÐÆ«ÒÆÁ¿(¼´keyÖµ)°üÀ¨ÁË»Ø³µËùÕ¼µÄ×Ö·ûÊý(Windows 
ºÍLinux»·¾³»á²»Í¬)¡£
Í¼3-5 ·Ö¸î¹ý³Ì

(2)½«·Ö¸îºÃµÄ<key,value>¶Ô½»¸ømap()·½·¨´¦Àí,Éú³ÉÐÂµÄ<key,value>¶Ô, 
ÈçÍ¼3-6ËùÊ¾¡£
Í¼3-6 Ó³Éä¹ý³Ì

(3)µÃµ½map()·½·¨Êä³öµÄ<key,value>¶Ôºó,Mapper»á½«ËüÃÇ°´ÕÕkeyÖµ½øÐÐÅÅ
Ðò,²¢Ö´ÐÐCombine¹ý³Ì,½«keyÖµÏàÍ¬µÄvalueÖµÀÛ¼Ó,µÃµ½MapperµÄ×îÖÕÊä³ö½á¹û, 
ÈçÍ¼3-7ËùÊ¾¡£
(4)ReducerÏÈ¶Ô´ÓMapper½ÓÊÕµÄÊý¾Ý½øÐÐÅÅÐò,ÔÙ½»ÓÉÓÃ»§×Ô¶¨ÒåµÄreduce()·½
·¨½øÐÐ´¦Àí,µÃµ½ÐÂµÄ<key,value>¶Ô,²¢×÷ÎªWordCountµÄÊä³ö½á¹û,ÈçÍ¼3-8ËùÊ¾¡£

3.2.2 
Eclipse·ÃÎÊHadop 
1. 
»ù´¡×¼±¸
(1)´Ó¹ÙÍøÏÂÔØhado-cis-lgn2.2.ar¡£
opelpepui-7.jtps:k.pceog/hdcisPuI

´ò¿ªÍøÒ³h//wiiaah.raop/Elpelgn,½øÈëÏÂÔØÒ³Ãæ,ÈçÍ¼39ËùÊ¾¡£

46 


47 
Í¼3-7 MapÅÅÐòÓëCombine¹ý³Ì
Í¼3-8 ReduceÅÅÐòÓëÊä³ö½á¹û
Í¼3-9 ÏÂÔØhadoop-eclipse-plugin-2.7.2.jarÒ³Ãæ
(2)ÈçÇ°Ãæ3.2.1½ÚËùÊö,Æô¶¯Hadoop¼¯Èº¡£
(3)ÔÚÃû×Ö½Úµã°²×°Eclipse,Ö´ÐÐÈçÏÂµÄÃüÁî¡£ 
#cd /usr/local

48 
#tar -zxvf eclipse-jee-luna-SR2-linux-gtk-x86_64.tar.gz 
#ln -s eclipse/eclipse /usr/bin/eclipse 
#vi /usr/share/applications/eclipse.desktop 
´ò¿ªÎÄ¼þºó,ÏÂÔØ3-3-2-1-eclipse-desktopÎÄ¼þ,×÷Îªeclipse.desktopÎÄ¼þµÄÄÚÈÝ¡£
(4)½«/usr/share/applicationsÏÂµÄeclipse.desktopÎÄ¼þ¸´ÖÆµ½×ÀÃæ¡£
(5)Æô¶¯Eclipse¡£
ÈçÍ¼3-10ËùÊ¾,ÒÀ´Îµ¥»÷Ó¦ÓÃ³ÌÐò¡ú±à³Ì¡úEclipse4.4.2,ÉèÖÃ²¢È·ÈÏ¡°/home/189/ 
workspace¡±¿Õ¼äºó,µ¥»÷OK°´Å¥ºóÔò³É¹¦Æô¶¯Eclipse,ÈçÍ¼3-11ËùÊ¾¡£
Í¼3-10 EclipseÆô¶¯Í¼±ê
Í¼3-11 Eclipse4.4.2¿ª·¢»·¾³½çÃæ

2
. 
°²×°Hadoop 
²å¼þ
ÈçÍ¼3-12ËùÊ¾,Winows×ÀÃæ»·¾³ÏÂ½èÖúWinSCP½«haop-cipeplgi-7.

ddoels-un2.2. 
jar¸´ÖÆµ½ÐéÄâ»úMasterÖ÷»úµÄeclipse/dropinsÄ¿Â¼ÖÐ¡£


Í¼3-12 ÓÃWinSCP½«hdo-cis-lgn2.2.ar¸´ÖÆµ½/s/elpe/doisÄ¿Â¼µÄ½çÃæ

aopelpepui-7.jurcisrpn

(1)ÅäÖÃDFSLocation¡£ÖØÆôEclipse,ÒÀ´ÎÑ¡ÔñWindow¡úshowview¡úother¡ú 
MapReduceTools/Map/ReduceLocations,µ¯³öÈçÍ¼3-13ËùÊ¾µÄ¶Ô»°¿ò,µ¥»÷Í¼3-13ÓÒ
ÏÂ½Ç¼ýÍ·ËùÖ¸Í¼±ê,ÐÂ½¨Î»ÖÃ,½øÈëÈçÍ¼3-14ËùÊ¾µÄ¶Ô»°¿ò,ÔÚMap/ReduceMaster×éµÄ
Hosr50.to
tºÍPt±à¼­¿òÖÐ·Ö±ðÊäÈë192.189ºÍ9001,ÔÚDFSMar×éµÄPtÖÐÊä

o168.ser
Èë9000,µ¥»÷Finish°´Å¥ºó³öÏÖÈçÍ¼3-15ËùÊ¾µÄMap/ReduceLocations¼ÇÂ¼¡£


Í¼3-13 Map/ReduceLocations²Ù×÷½çÃæ

(2)ÐÂ½¨Map/ReduceÏîÄ¿¡£ÔÚEclipseÖÐÒÀ´ÎÑ¡ÔñFile¡úNew¡úOther.
¡úMap/
ReduceProject¡úNext,ÊäÈëÏîÄ¿ÃûTestWordCountºó,ä¯ÀÀ²¢Ñ¡ÔñHadoopÂ·¾¶/usr/
local/hadoop,µ¥»÷Finish°´Å¥,ÔòÏîÄ¿TestWordCount´´½¨³É¹¦,´ËÊ±ÏîÄ¿ä¯ÀÀ½çÃæÈç
Í¼3-16ËùÊ¾¡£
(3)Ìí¼Ó²¢±àÐ´WordCountjavaÔ´ÎÄ¼þ,ÆäÏîÄ¿ä¯ÀÀ½çÃæÈçÍ¼317ËùÊ¾¡£
.

49 


50
Í¼3-14 NewHadoopLocation¶Ô»°¿ò
Í¼3-15 Map/ReduceLocations½çÃæ
Í¼3-16 ÐÂ½¨Map/ReduceÏîÄ¿³É¹¦ºóµÄÏîÄ¿ä¯ÀÀ½çÃæ

51 
Í¼3-17 Ìí¼ÓWordCountÔ´ÎÄ¼þºóµÄÏîÄ¿ä¯ÀÀ½çÃæ 
ÏÂÔØ3-3-2-2-eclipse-WordCountÔ´³ÌÐòÎÄ¼þ,×÷ÎªWordCount.javaµÄÄÚÈÝ¡£
(4)ÅäÖÃÔËÐÐ²ÎÊý¡£ÔÚmaster½ÚµãÖÐÐÂ½¨Ò»¸öHDFS¸ñÊ½µÄtmpÄ¿Â¼,Ö´ÐÐÈçÏÂµÄ
ÃüÁî¡£ 
#hadoop fs -mkdir /tmp 
ÐÞ¸ÄÄ¿Â¼È¨ÏÞ,Ö´ÐÐÈçÏÂµÄÃüÁî¡£ 
#hadoop fs -chmod -R 777 /tmp 
(5)ÔÚEclipse±¾µØ¿ª·¢»·¾³ÖÐÐÂ½¨Ò»¸öÎÄ¼þinput01,ÆäÎÄ¼þÄÚÈÝÈçÏÂ¡£ 
hello world 
hello china 
hello jiangsu 
hello suzhou 
(6)ÅäÖÃRunConfigurations¡£ÔÚEclipseÖÐÒÀ´Îµ¥»÷Run¡úRunConfigurations,ÒÔ
ÅäÖÃÊäÈë/Êä³ö²ÎÊý,ÈçÍ¼3-18ËùÊ¾¡£
Í¼3-18 ÔËÐÐÅäÖÃ¶Ô»°¿ò

52 
(7)µ¥»÷Run°´Å¥,Æô¶¯Ó¦ÓÃ³ÌÐò¡£
ÅäÖÃ²ÎÊýÍê³Éºó,µ¥»÷Í¼3-18µÄRun°´Å¥,Æô¶¯Ó¦ÓÃ³ÌÐò,ÔËÐÐ½á¹ûÈçÍ¼3-19ËùÊ¾¡£
Í¼3-19 ÔËÐÐ½á¹û½çÃæ
3.2.3 ×ÔÑµÈÎÎñºÍ°¸ÀýÊµ¼ùË¼¿¼
1. ×ÔÑµÈÎÎñ
ÔÚÐéÄâ»úÉÏ²¿ÊðHadoop3.1.1Î±·Ö²¼Ê½¼¯Èº,ÒªÇóÈçÏÂ¡£
(1)3¸ö½Úµã,¼´1¸öÃû×Ö½ÚµãºÍ2¸öÊý¾Ý½Úµã¡£
(2)Ö÷»úÃûÓÉ2²¿·Ö¹¹³É,Ãû×Ö½ÚµãºÍÊý¾Ý½ÚµãµÄÖ÷»úÃûÇ°°ë²¿·Ö·Ö±ðÎªmaster»ò
slave,ºó°ë²¿·ÖÎª¸öÈËÑ§ºÅµÄºó3Î»¡£
(3)²¿ÊðÍê³Éºó´ò¿ªÍøÒ³http://masterXXX:50070,XXXÎª¸öÈËÑ§ºÅµÄºó3Î»,¹Û
²ì¼¯Èº×´Ì¬¡£
(4)ÔËÐÐHadoop3.1.1×Ô´øµÄWordCountµ¥´Ê¸öÊýÍ³¼ÆÑùÀý°ü¡£
(5)ÐÂ½¨EclipseMap/ReduceÏîÄ¿,Çó½ân ¸öÊýµÄ×î´óÖµ¡£
(6)ÒÔWordÎÄµµÌá½»ÍêÕûµÄ²¿Êð¹ý³ÌÎÄµµ¡£ÔËÐÐ½á¹û½ØÆÁÎªÖ¤,ÌåÏÖ¸öÈËÖ÷»ú
ÌØÕ÷¡£
(7)Í¼Ê¾¸ø³öÇó½â×î´óÖµµÄ¾ßÌå¹ý³Ì¡£
2. °¸ÀýÊµ¼ùË¼¿¼
¸ù¾ÝË®ÎñÔÆÆ½Ì¨µÄ½â¾ö·½°¸,¸ø³ö»ùÓÚHadoopÉúÌ¬»·¾³µÄ´æ´¢ÏµÍ³¼Ü¹¹Éè¼Æ·½°¸¡£
3.3 Ceph ·Ö²¼Ê½´æ´¢
3.3.1 CephÕûÌå¼Ü¹¹
1. Ceph ÕûÌå¼Ü¹¹ 
Ceph¼Ü¹¹»ùÓÚÈ¥ÖÐÐÄ»¯ºÍ¸ß¿É¿¿ÐÔ¡¢¸ß¶È×Ô¶¯»¯¡¢¸ß¿ÉÀ©Õ¹ÐÔµÄÉè¼ÆË¼Â·,ÆäÕûÌå¼Ü
¹¹ÈçÍ¼3-20ËùÊ¾¡£