HBase»ù±¾¸ÅÄîÓë»ù±¾Ê¹ÓÃ

168Ö÷±à ·¢±íÓÚ 2020-12-28 14:46:38

±¾Ìû×îºóÓÉ 168Ö÷±à ÓÚ 2020-12-28 14:47 ±à¼

1. HBase¼ò½é1.1 Ê²Ã´ÊÇHBase¡¡¡¡HBASEÊÇÒ»¸ö¸ß¿É¿¿ÐÔ¡¢¸ßÐÔÄÜ¡¢ÃæÏòÁÐ¡¢¿ÉÉìËõµÄ·Ö²¼Ê½´æ´¢ÏµÍ³£¬ÀûÓÃHBASE¼¼Êõ¿ÉÔÚÁ®¼ÛPC ServerÉÏ´î½¨Æð´ó¹æÄ£½á¹¹»¯´æ´¢¼¯Èº¡£¡¡¡¡HBASEµÄÄ¿±êÊÇ´æ´¢²¢´¦Àí´óÐÍµÄÊý¾Ý£¬¸ü¾ßÌåÀ´ËµÊÇ½öÐèÊ¹ÓÃÆÕÍ¨µÄÓ²¼þÅäÖÃ£¬¾ÍÄÜ¹»´¦ÀíÓÉ³ÉÇ§ÉÏÍòµÄÐÐºÍÁÐËù×é³ÉµÄ´óÐÍÊý¾Ý¡£¡¡¡¡HBASEÊÇGoogle BigtableµÄ¿ªÔ´ÊµÏÖ£¬µ«ÊÇÒ²ÓÐºÜ¶à²»Í¬Ö®´¦¡£±ÈÈç£ºGoogle BigtableÊ¹ÓÃGFS×÷ÎªÆäÎÄ¼þ´æ´¢ÏµÍ³£¬HBASEÀûÓÃHadoop HDFS×÷ÎªÆäÎÄ¼þ´æ´¢ÏµÍ³£»GoogleÔËÐÐMAPREDUCEÀ´´¦ÀíBigtableÖÐµÄº£Á¿Êý¾Ý£¬HBASEÍ¬ÑùÀûÓÃHadoop MapReduceÀ´´¦ÀíHBASEÖÐµÄº£Á¿Êý¾Ý£»Google BigtableÀûÓÃChubby×÷ÎªÐÍ¬·þÎñ£¬HBASEÀûÓÃZookeeper×÷ÎªÐÍ¬·þÎñ¡£1.2 Óë´«Í³Êý¾Ý¿âµÄ¶Ô±È1¡¢´«Í³Êý¾Ý¿âÓöµ½µÄÎÊÌâ£º¡¡¡¡1£©Êý¾ÝÁ¿ºÜ´óµÄÊ±ºòÎÞ·¨´æ´¢£»
¡¡¡¡2£©Ã»ÓÐºÜºÃµÄ±¸·Ý»úÖÆ£»
¡¡¡¡3£©Êý¾Ý´ïµ½Ò»¶¨ÊýÁ¿¿ªÊ¼»ºÂý£¬ºÜ´óµÄ»°»ù±¾ÎÞ·¨Ö§³Å£»2¡¢HBASEÓÅÊÆ£º¡¡¡¡1£©ÏßÐÔÀ©Õ¹£¬Ëæ×ÅÊý¾ÝÁ¿Ôö¶à¿ÉÒÔÍ¨¹ý½ÚµãÀ©Õ¹½øÐÐÖ§³Å£»
¡¡¡¡2£©Êý¾Ý´æ´¢ÔÚhdfsÉÏ£¬±¸·Ý»úÖÆ½¡È«£»
¡¡¡¡3£©Í¨¹ýzookeeperÐµ÷²éÕÒÊý¾Ý£¬·ÃÎÊËÙ¶È¿ì¡£1.3 HBase¼¯ÈºÖÐµÄ½ÇÉ«
[*]Ò»¸ö»òÕß¶à¸öÖ÷½Úµã£¬Hmaster£»
[*]¶à¸ö´Ó½Úµã£¬HregionServer£»
[*]HBaseÒÀÀµÏî£¬zookeeper£»

2. HBaseÊý¾ÝÄ£ÐÍ¡¡¡¡ https://images2018.cnblogs.com/blog/1217276/201804/1217276-20180412165246351-1504091538.png2.1 HBaseµÄ´æ´¢»úÖÆ¡¡¡¡HBaseÊÇÒ»¸öÃæÏòÁÐµÄÊý¾Ý¿â£¬ÔÚ±íÖÐËüÓÉÐÐÅÅÐò¡£±íÄ£Ê½¶¨ÒåÖ»ÄÜÁÐ×å£¬Ò²¾ÍÊÇ¼üÖµ¶Ô¡£Ò»¸ö±íÓÐ¶à¸öÁÐ×åÒÔ¼°Ã¿Ò»¸öÁÐ×å¿ÉÒÔÓÐÈÎÒâÊýÁ¿µÄÁÐ¡£ºóÐøÁÐµÄÖµÁ¬Ðø´æ´¢ÔÚ´ÅÅÌÉÏ¡£±íÖÐµÄÃ¿¸öµ¥Ôª¸ñÖµ¶¼¾ßÓÐÊ±¼ä´Á¡£×ÜÖ®£¬ÔÚÒ»¸öHBase£º
[*]

[*]±íÊÇÐÐµÄ¼¯ºÏ¡£
[*]ÐÐÊÇÁÐ×åµÄ¼¯ºÏ¡£
[*]ÁÐ×åÊÇÁÐµÄ¼¯ºÏ¡£
[*]ÁÐÊÇ¼üÖµ¶ÔµÄ¼¯ºÏ¡£

¡¡¡¡ÕâÀïµÄÁÐÊ½´æ´¢»òÕßËµÃæÏòÁÐ£¬ÆäÊµËµµÄÊÇÁÐ×å´æ´¢£¬HBaseÊÇ¸ù¾ÝÁÐ×åÀ´´æ´¢Êý¾ÝµÄ¡£ÁÐ×åÏÂÃæ¿ÉÒÔÓÐ·Ç³£¶àµÄÁÐ£¬ÁÐ×åÔÚ´´½¨±íµÄÊ±ºò¾Í±ØÐëÖ¸¶¨¡£HBase ºÍ RDBMSµÄ±È½Ï¡¡¡¡https://images2018.cnblogs.com/blog/1217276/201805/1217276-20180502160419739-1372070262.pngRDBMSµÄ±í£º¡¡¡¡https://images2018.cnblogs.com/blog/1217276/201805/1217276-20180502160625443-336515309.pngHBaseµÄ±í£º¡¡¡¡https://images2018.cnblogs.com/blog/1217276/201805/1217276-20180502160640314-1773712421.png2.2 Row Key ÐÐ¼ü¡¡¡¡ÓënosqlÊý¾Ý¿âÒ»Ñù£¬row keyÊÇÓÃÀ´±íÊ¾Î¨Ò»Ò»ÐÐ¼ÇÂ¼µÄÖ÷¼ü£¬HBaseµÄÊý¾ÝÊ±°´ÕÕRowKeyµÄ×ÖµäË³Ðò½øÐÐÈ«¾ÖÅÅÐòµÄ£¬ËùÓÐµÄ²éÑ¯¶¼Ö»ÄÜÒÀÀµÓÚÕâÒ»¸öÅÅÐòÎ¬¶È¡£·ÃÎÊHBASE tableÖÐµÄÐÐ£¬Ö»ÓÐÈýÖÖ·½Ê½£º
[*]

[*]Í¨¹ýµ¥¸örow key·ÃÎÊ£»
[*]Í¨¹ýrow keyµÄrange£¨ÕýÔò£©
[*]È«±íÉ¨Ãè

¡¡¡¡Rowkey ÐÐ¼ü£¨Row key£©¿ÉÒÔÊÇÈÎÒâ×Ö·û´®(×î´ó³¤¶ÈÊÇ64KB£¬Êµ¼ÊÓ¦ÓÃÖÐ³¤¶ÈÒ»°ãÎª10-1000bytes)£¬ÔÚHBASEÄÚ²¿£¬rowkey±£´æÎª×Ö½ÚÊý×é¡£´æ´¢Ê±£¬Êý¾Ý°´ÕÕRowkeyµÄ×ÖµäÐò(byteorder)ÅÅÐò´æ´¢¡£Éè¼ÆkeyÊ±£¬Òª³ä·ÖÅÅÐò´æ´¢Õâ¸öÌØÐÔ£¬½«¾³£Ò»Æð¶ÁÈ¡µÄÐÐ´æ´¢·Åµ½Ò»Æð¡£(Î»ÖÃÏà¹ØÐÔ)2.3 ColumnsFamily ÁÐ×å¡¡¡¡ÁÐ´Ø£ºHBASE±íÖÐµÄÃ¿¸öÁÐ£¬¶¼¹éÊôÓÚÄ³¸öÁÐ×å¡£ÁÐ×åÊÇ±íµÄschemaµÄÒ»²¿·Ö(¶øÁÐ²»ÊÇ)£¬±ØÐëÔÚÊ¹ÓÃ±íÖ®Ç°¶¨Òå¡£ÁÐÃû¶¼ÒÔÁÐ×å×÷ÎªÇ°×º¡£ÀýÈçcourses£ºhistory£¬courses£ºmath ¶¼ÊôÓÚcoursesÕâ¸öÁÐ×å¡£2.4 Cell¡¡¡¡ÓÉ{row key£¬columnFamily£¬version} Î¨Ò»È·¶¨µÄµ¥Ôª¡£cellÖÐµÄÊý¾ÝÊÇÃ»ÓÐÀàÐÍµÄ£¬È«²¿ÊÇ×Ö½ÚÂëÐÎÊ½´æ´¢¡£2.5 Time Stamp Ê±¼ä´Á¡¡¡¡HBASEÖÐÍ¨¹ýrowkeyºÍcolumnsÈ·¶¨µÄÎªÒ»¸ö´æ´¢µ¥Ôª³ÆÎªcell¡£Ã¿¸öcell¶¼±£´æ×ÅÍ¬Ò»·ÝÊý¾ÝµÄ¶à¸ö°æ±¾¡£°æ±¾Í¨¹ýÊ±¼ä´ÁÀ´Ë÷Òý¡£Ê±¼ä´ÁµÄÀàÐÍÊÇ64Î»ÕûÐÍ¡£Ê±¼ä´Á¿ÉÒÔÓÉHBASE(ÔÚÊý¾ÝÐ´ÈëÊ±×Ô¶¯)¸³Öµ£¬´ËÊ±Ê±¼ä´ÁÊÇ¾«È·µ½ºÁÃëµÄµ±Ç°ÏµÍ³Ê±¼ä¡£Ê±¼ä´ÁÒ²¿ÉÒÔÓÉ¿Í»§ÏÔÊ¾¸³Öµ¡£Èç¹ûÓ¦ÓÃ³ÌÐòÒª±ÜÃâÊý¾Ý°æ±¾³åÍ»£¬¾Í±ØÐë×Ô¼ºÉú³É¾ßÓÐÎ¨Ò»ÐÔµÄÊ±¼ä´Á¡£Ã¿¸öcellÖÐ£¬²»Í¬°æ±¾µÄÊý¾Ý°´ÕÕÊ±¼äµ¹ÐòÅÅÐò£¬¼´×îÐÂµÄÊý¾ÝÅÅÔÚ×îÇ°Ãæ¡£¡¡¡¡ÎªÁË±ÜÃâÊý¾Ý´æÔÚ¹ý¶à°æ±¾Ôì³ÉµÄ¹ÜÀí(°üÀ¨´æ´¢ºÍË÷Òý)¸ºµ££¬HBASEÌá¹©ÁËÁ½ÖÖÊý¾Ý°æ±¾»ØÊÕ·½Ê½¡£Ò»ÊÇ±£´æÊý¾ÝµÄ×îºón¸ö°æ±¾£¬¶øÊÇ±£´æ×î½üÒ»¶ÎÊ±¼äÄÚµÄ°æ±¾(±ÈÈç×î½ü7Ìì)¡£ÓÃ»§¿ÉÒÔÕë¶ÔÃ¿¸öÁÐ×å½øÐÐÉèÖÃ¡£3. HBaseÔÀí HBaseÏµÍ³¼Ü¹¹ÌåÏµÍ¼¡¡¡¡https://images2018.cnblogs.com/blog/1217276/201805/1217276-20180502141711373-31653278.png×é³É²¿¼þËµÃ÷£ºClient£º¡¡¡¡Ê¹ÓÃHBase RPC»úÖÆÓëHMasterºÍHRegionServer½øÐÐÍ¨ÐÅ
¡¡¡¡ClientÓëHMaster½øÐÐ¹ÜÀíÀà²Ù×÷
¡¡¡¡ClientÓëHRegionServer½øÐÐÊý¾Ý¶ÁÐ´Àà²Ù×÷Zookeeper£º¡¡¡¡Zookeeper Quorum´æ´¢-ROOT-±íµØÖ·¡¢HMasterµØÖ·
¡¡¡¡HRegionServer°Ñ×Ô¼ºÒÔEphemeral·½Ê½×¢²áµ½ZookeeperÖÐ£¬HMasterËæÊ±¸ÐÖª¸÷¸öHRegionServerµÄ½¡¿µ×´¿ö
¡¡¡¡Zookeeper±ÜÃâHMasterµ¥µãÎÊÌâ¡¡¡¡ZookeeperµÄÖ÷Òª×÷ÓÃ£º¿Í»§¶ËÊ×ÏÈÁªÏµZooKeeper×Ó¼¯Èº£¨quorum£©£¨Ò»¸öÓÉZooKeeper½Úµã×é³ÉµÄµ¥¶À¼¯Èº£©²éÕÒÐÐ½¡¡£ÉÏÊö¹ý³ÌÊÇÍ¨¹ýZooKeeper»ñÈ¡º¬ÓÐ-ROOT-µÄregion·þÎñÆ÷Ãû£¨Ö÷»úÃû£©À´Íê³ÉµÄ¡£Í¨¹ýº¬ÓÐ-ROOT-µÄregion·þÎñÆ÷¿ÉÒÔ²éÑ¯µ½º¬ÓÐ.META.±íÖÐ¶ÔÓ¦µÄregion·þÎñÆ÷Ãû£¬ÆäÖÐ°üº¬ÇëÇóµÄÐÐ½¡ÐÅÏ¢¡£ÕâÁ½´¦µÄÖ÷ÒªÄÚÈÝ¶¼±»»º´æÏÂÀ´ÁË£¬²¢ÇÒ¶¼Ö»²éÑ¯Ò»´Î¡£×îÖÕ£¬Í¨¹ý²éÑ¯.META·þÎñÆ÷À´»ñÈ¡¿Í»§¶Ë²éÑ¯µÄÐÐ½¡Êý¾ÝËùÔÚregionµÄ·þÎñÆ÷Ãû¡£Ò»µ©ÖªµÀÁËÊý¾ÝµÄÊµ¼ÊÎ»ÖÃ£¬¼´regionµÄÎ»ÖÃ£¬HBase»á»º´æÕâ´Î²éÑ¯µÄÐÅÏ¢£¬Í¬Ê±Ö±½ÓÁªÏµ¹ÜÀíÊµ¼ÊÊý¾ÝµÄHRegionServer¡£ËùÒÔ£¬Ö®ºó¿Í»§¶Ë¿ÉÒÔÍ¨¹ý»º´æÐÅÏ¢ºÜºÃµØ¶¨Î»ËùÐèµÄÊý¾ÝÎ»ÖÃ£¬¶ø²»ÓÃÔÙ´Î²éÕÒ.META.±í¡£HMaster£º¡¡¡¡HMasterÃ»ÓÐµ¥µãÎÊÌâ£¬HBase¿ÉÒÔÆô¶¯¶à¸öHMaster£¬Í¨¹ýZookeeperµÄMaster Election»úÖÆ±£Ö¤×ÜÓÐÒ»¸öMasterÔÚÔËÐÐ
¡¡¡¡Ö÷Òª¸ºÔðTableºÍRegionµÄ¹ÜÀí¹¤×÷£º
[*]

[*]¹ÜÀíÓÃ»§¶Ô±íµÄÔöÉ¾¸Ä²é²Ù×÷
[*]¹ÜÀíHRegionServerµÄ¸ºÔØ¾ùºâ£¬µ÷ÕûRegion·Ö²¼
[*]Region Splitºó£¬¸ºÔðÐÂRegionµÄ·Ö²¼
[*]ÔÚHRegionServerÍ£»úºó£¬¸ºÔðÊ§Ð§HRegionServerÉÏRegionÇ¨ÒÆ

HRegionServer£º¡¡¡¡HBaseÖÐ×îºËÐÄµÄÄ£¿é£¬Ö÷Òª¸ºÔðÏìÓ¦ÓÃ»§I/OÇëÇó£¬ÏòHDFSÎÄ¼þÏµÍ³ÖÐ¶ÁÐ´¡¡¡¡https://images2018.cnblogs.com/blog/1217276/201805/1217276-20180502154607794-710652455.png https://images2018.cnblogs.com/blog/1217276/201805/1217276-20180502155839968-280021952.png¡¡¡¡HRegionServer¹ÜÀíÒ»ÏµÁÐHRegion¶ÔÏó£»
¡¡¡¡Ã¿¸öHRegion¶ÔÓ¦TableÖÐÒ»¸öRegion£¬HRegionÓÉ¶à¸öHStore×é³É£»
¡¡¡¡Ã¿¸öHStore¶ÔÓ¦TableÖÐÒ»¸öColumn FamilyµÄ´æ´¢£»
¡¡¡¡Column Family¾ÍÊÇÒ»¸ö¼¯ÖÐµÄ´æ´¢µ¥Ôª£¬¹Ê½«¾ßÓÐÏàÍ¬IOÌØÐÔµÄColumn·ÅÔÚÒ»¸öColumn Family»á¸ü¸ßÐ§¡£¡¡¡¡¿ÉÒÔ¿´µ½£¬client·ÃÎÊhbaseÉÏµÄÊý¾Ý²¢²»ÐèÒªmaster²ÎÓë£¨Ñ°Ö··ÃÎÊzookeeperºÍregion server£¬Êý¾Ý¶ÁÐ´·ÃÎÊregion server£©£¬master½ö½öÎ¬»¤tableºÍregionµÄÔªÊý¾ÝÐÅÏ¢£¨tableµÄÔªÊý¾ÝÐÅÏ¢±£´æÔÚzookeeperÉÏ£©£¬¸ºÔØºÜµÍ¡£HRegionServer´æÈ¡Ò»¸ö×Ó±íÊ±£¬»á´´½¨Ò»¸öHRegion¶ÔÏó£¬È»ºó¶Ô±íµÄÃ¿¸öÁÐ×å´´½¨Ò»¸öStoreÊµÀý£¬Ã¿¸öStore¶¼»áÓÐÒ»¸öMemStoreºÍ0¸ö»ò¶à¸öStoreFileÓëÖ®¶ÔÓ¦£¬Ã¿¸öStoreFile¶¼»á¶ÔÓ¦Ò»¸öHFile£¬HFile¾ÍÊÇÊµ¼ÊµÄ´æ´¢ÎÄ¼þ¡£Òò´Ë£¬Ò»¸öHRegion£¨±í£©ÓÐ¶àÉÙ¸öÁÐ×å¾ÍÓÐ¶àÉÙ¸öStore¡£Ò»¸öHRegionServer»áÓÐ¶à¸öHRegionºÍÒ»¸öHLog¡£HRegion£º¡¡¡¡tableÔÚÐÐµÄ·½ÏòÉÏ·Ö¸ôÎª¶à¸öRegion¡£RegionÊÇHBaseÖÐ·Ö²¼Ê½´æ´¢ºÍ¸ºÔØ¾ùºâµÄ×îÐ¡µ¥Ôª£¬¼´²»Í¬µÄregion¿ÉÒÔ·Ö±ðÔÚ²»Í¬µÄRegion ServerÉÏ£¬µ«Í¬Ò»¸öRegionÊÇ²»»á²ð·Öµ½¶à¸öserverÉÏ¡£¡¡¡¡Region°´´óÐ¡·Ö¸ô£¬Ã¿¸ö±íÒ»°ãÊÇÖ»ÓÐÒ»¸öregion¡£Ëæ×ÅÊý¾Ý²»¶Ï²åÈë±í£¬region²»¶ÏÔö´ó£¬µ±regionµÄÄ³¸öÁÐ×å´ïµ½Ò»¸ö·§Öµ£¨Ä¬ÈÏ256M£©Ê±¾Í»á·Ö³ÉÁ½¸öÐÂµÄregion¡£¡¡¡¡Ã¿¸öregionÓÉÒÔÏÂÐÅÏ¢±êÊ¶£º
[*]

[*]<±íÃû£¬startRowKey£¬´´½¨Ê±¼ä>
[*]ÓÉÄ¿Â¼±í(-ROOT-ºÍ.META.)¼ÇÂ¼¸ÃregionµÄendRowKey

¡¡¡¡HRegion¶¨Î»£ºRegion±»·ÖÅä¸øÄÄ¸öRegionServerÊÇÍêÈ«¶¯Ì¬µÄ£¬ËùÒÔÐèÒª»úÖÆÀ´¶¨Î»Region¾ßÌåÔÚÄÄ¸öregion server¡£¡¡¡¡HBaseÊ¹ÓÃÈý²ã½á¹¹À´¶¨Î»region£º
[*]

[*]Í¨¹ýzookeeperÀïµÄÎÄ¼þ/hbase/rsµÃµ½-ROOT-±íµÄÎ»ÖÃ¡£-ROOT-±íÖ»ÓÐÒ»¸öregion¡£
[*]Í¨¹ý-ROOT-±í²éÕÒ.META.±íµÄµÚÒ»¸ö±íÖÐÏàÓ¦µÄregionµÄÎ»ÖÃ¡£.META.±íÖÐµÄÃ¿Ò»¸öregionÔÚ-ROOT-±íÖÐ¶¼ÊÇÒ»ÐÐ¼ÇÂ¼¡£
[*]Í¨¹ý.META.±íÕÒµ½ËùÒªµÄÓÃ»§±íregionµÄÎ»ÖÃ¡£ÓÃ»§±íÖÐµÄÃ¿¸öregionÔÚ.META±íÖÐ¶¼ÊÇÒ»ÐÐ¼ÇÂ¼¡£

¡¡¡¡Õâ¸ö²éÕÒ¹ý³Ì¾ÍÏñÒ»¸ö3²ã·Ö²¼Ê½B+Ê÷(¼ûÏÂÍ¼)£¬-ROOT-±íÊÇB+Ê÷µÄ-ROOT-½Úµã¡£.META. regionÊÇ-ROOT-½Úµã(-ROOT-region)µÄÒ¶×Ó£¬ÓÃ»§±íµÄregionÊÇ.META.regionµÄÒ¶×Ó¡£¡¡¡¡https://img2020.cnblogs.com/blog/1217276/202005/1217276-20200525145424656-1183291276.png¡¡¡¡×¢Òâ£º ¡¡¡¡-ROOT-±íÓÀÔ¶²»»á±»·Ö¸ôÎª¶à¸öregion£¬±£Ö¤ÁË×î¶àÐèÒªÈý´ÎÌø×ª£¬¾ÍÄÜ¶¨Î»µ½ÈÎÒâµÄregion¡£client»á½«²éÑ¯µÄÎ»ÖÃÐÅÏ¢»º´æÆðÀ´£¬»º´æ²»»áÖ÷¶¯Ê§Ð§£¬Òò´ËÈç¹ûclientÉÏµÄ»º´æÈ«²¿Ê§Ð§£¬ÔòÐèÒª½øÐÐ6´ÎÍøÂçÀ´»Ø£¬²ÅÄÜ¶¨Î»µ½ÕýÈ·µÄregion£¬ÆäÖÐÈý´ÎÓÃÀ´·¢ÏÖ»º´æÊ§Ð§£¬ÁíÍâÈý´ÎÓÃÀ´»ñÈ¡Î»ÖÃÐÅÏ¢¡£¡¡¡¡tableºÍregionµÄ¹ØÏµ£º¡¡¡¡tableÄ¬ÈÏ×î³õÖ»ÓÐÒ»¸öregion£¬Ëæ×Å¼ÇÂ¼ÊýµÄ²»¶ÏÔö¼Ó¶ø±ä´ó£¬Æð³õµÄregion»áÖð½¥·ÖÁÑ³É¶à¸öregion£¬Ò»¸öregionÓÐ¡¾startKey, endKey¡¿±íÊ¾£¬²»Í¬µÄregion»á±»master·ÖÅä¸øÏàÓ¦µÄregionserver¹ÜÀí¡£regionÊÇhbase·Ö²¼Ê½´æ´¢ºÍ¸ºÔØ¾ùºâµÄ×îÐ¡µ¥Ôª£¬²»Í¬µÄregion·Ö²»µ½²»Í¬µÄregionServer¡£regionËäÈ»ÊÇ·Ö²¼Ê½´æ´¢µÄ×îÐ¡µ¥Ôª£¬µ«²¢²»ÊÇ´æ´¢µÄ×îÐ¡µ¥Ôª¡£regionÊÇÓÉÒ»¸ö»òÕß¶à¸östore×é³ÉµÄ£¬Ã¿¸östore¾ÍÊÇÒ»¸öcolumn family¡£Ã¿¸östoreÓÖÓÉmemStoreºÍ1ÖÁ¶à¸östore file ×é³É(memstoreµ½Ò»¸ö·§Öµ»áË¢ÐÂ£¬Ð´Èëµ½storefile£¬ÓÐhlogÀ´±£Ö¤Êý¾ÝµÄ°²È«ÐÔ£¬Ò»¸öregionServerÓÐÇÒÖ»ÓÐÒ»¸öhlog)¡¡¡¡¡¡¡¡¡¡¡¡¡¡¡¡¡¡¡¡¡¡¡¡¡¡¡¡¡¡¡¡¡¡¡¡¡¡¡¡¡¡¡¡¡¡¡¡¡¡¡¡¡¡¡¡¡¡¡¡¡¡¡¡¡¡¡¡¡¡¡¡¡¡HStore£º¡¡¡¡HBase´æ´¢µÄºËÐÄ¡£ÓÉMemStoreºÍStoreFile×é³É¡£MemStoreÊÇStored Memory Buffer¡£
HLog£º¡¡¡¡ÒýÈëHLogÔÒò£ºÔÚ·Ö²¼Ê½ÏµÍ³»·¾³ÖÐ£¬ÎÞ·¨±ÜÃâÏµÍ³³ö´í»òÕßå´»ú£¬Ò»µ©HRegionServerÒâÍâÍË³ö£¬MemStoreÖÐµÄÄÚ´æÊý¾Ý¾Í»á¶ªÊ§£¬ÒýÈëHLog¾ÍÊÇ·ÀÖ¹ÕâÖÖÇé¿ö¡£¡¡¡¡¹¤×÷»úÖÆ£º
¡¡¡¡Ã¿¸öHRegionServerÖÐ¶¼»áÓÐÒ»¸öHLog¶ÔÏó£¬HLogÊÇÒ»¸öÊµÏÖWrite Ahead LogµÄÀà£¬Ã¿´ÎÓÃ»§²Ù×÷Ð´ÈëMemStoreµÄÍ¬Ê±£¬Ò²»áÐ´Ò»·ÝÊý¾Ýµ½HLogÎÄ¼þ£¬HLogÎÄ¼þ¶¨ÆÚ»á¹ö¶¯³öÐÂ£¬²¢É¾³ý¾ÉµÄÎÄ¼þ(ÒÑ³Ö¾Ã»¯µ½StoreFileÖÐµÄÊý¾Ý)¡£µ±HRegionServerÒâÍâÖÕÖ¹ºó£¬HMaster»áÍ¨¹ýZookeeper¸ÐÖª£¬HMasterÊ×ÏÈ´¦ÀíÒÅÁôµÄHLogÎÄ¼þ£¬½«²»Í¬regionµÄlogÊý¾Ý²ð·Ö£¬·Ö±ð·Åµ½ÏàÓ¦regionÄ¿Â¼ÏÂ£¬È»ºóÔÙ½«Ê§Ð§µÄregionÖØÐÂ·ÖÅä£¬ÁìÈ¡µ½ÕâÐ©regionµÄHRegionServerÔÚLoad RegionµÄ¹ý³ÌÖÐ£¬»á·¢ÏÖÓÐÀúÊ·HLogÐèÒª´¦Àí£¬Òò´Ë»áReplay HLogÖÐµÄÊý¾Ýµ½MemStoreÖÐ£¬È»ºóflushµ½StoreFiles£¬Íê³ÉÊý¾Ý»Ö¸´¡£3.1 HBaseµÄ´æ´¢¸ñÊ½¡¡¡¡HBaseÖÐµÄËùÓÐÊý¾ÝÎÄ¼þ¶¼´æ´¢ÔÚHadoop HDFSÎÄ¼þÏµÍ³ÉÏ£¬¸ñÊ½Ö÷ÒªÓÐÁ½ÖÖ£º
[*]

[*]HFile£¬HBaseÖÐKey-ValueÊý¾ÝµÄ´æ´¢¸ñÊ½£¬HFileÊÇHadoopµÄ¶þ½øÖÆ¸ñÊ½ÎÄ¼þ£¬Êµ¼ÊÉÏStoreFile¾ÍÊÇ¶ÔHFile×öÁËÇáÁ¿¼¶°ü×°£¬¼´StoreFileµ×²ã¾ÍÊÇHFile¡£
[*]HLog File£¬HBaseÖÐWAL(Write Ahead Log)µÄ´æ´¢¸ñÊ½£¬ÎïÀíÉÏÊÇHadoopµÄSequence File

HFile¡¡¡¡https://images2018.cnblogs.com/blog/1217276/201805/1217276-20180503005707958-1447071381.jpg¡¡¡¡½âÎö£º¡¡¡¡HFileÎÄ¼þ²»¶¨³¤£¬³¤¶È¹Ì¶¨µÄ¿éÖ»ÓÐÁ½¸ö£ºTrailerºÍFileInfo¡¡¡¡TrailerÖÐÖ¸ÕëÖ¸ÏòÆäËûÊý¾Ý¿éµÄÆðÊ¼µã¡¡¡¡File InfoÖÐ¼ÇÂ¼ÁËÎÄ¼þµÄÒ»Ð©MetaÐÅÏ¢£¬ÀýÈç£ºAVG_KEY_LEN, AVG_VALUE_LEN, LAST_KEY, COMPARATOR, MAX_SEQ_ID_KEYµÈ¡¡¡¡Data IndexºÍMeta Index¿é¼ÇÂ¼ÁËÃ¿¸öData¿éºÍMeta¿éµÄÆðÊ¼µã¡¡¡¡Data BlockÊÇHBase I/OµÄ»ù±¾µ¥Ôª£¬ÎªÁËÌá¸ßÐ§ÂÊ£¬HRegionServerÖÐÓÐ»ùÓÚLRUµÄBlock Cache»úÖÆ¡¡¡¡Ã¿¸öData¿éµÄ´óÐ¡¿ÉÒÔÔÚ´´½¨Ò»¸öTableµÄÊ±ºòÍ¨¹ý²ÎÊýÖ¸¶¨£¬´óºÅµÄBlockÓÐÀûÓÚË³ÐòScan£¬Ð¡ºÅBlockÀûÓÚËæ»ú²éÑ¯ ¡¡¡¡Ã¿¸öData¿é³ýÁË¿ªÍ·µÄMagicÒÔÍâ¾ÍÊÇÒ»¸ö¸öKeyValue¶ÔÆ´½Ó¶ø³É, MagicÄÚÈÝ¾ÍÊÇÒ»Ð©Ëæ»úÊý×Ö£¬Ä¿µÄÊÇ·ÀÖ¹Êý¾ÝËð»µ¡¡¡¡HFileÀïÃæµÄÃ¿¸öKeyValue¶Ô¾ÍÊÇÒ»¸ö¼òµ¥µÄbyteÊý×é¡£Õâ¸öbyteÊý×éÀïÃæ°üº¬ÁËºÜ¶àÏî£¬²¢ÇÒÓÐ¹Ì¶¨µÄ½á¹¹¡£¡¡¡¡https://images2018.cnblogs.com/blog/1217276/201805/1217276-20180503010131198-724999946.jpg¡¡¡¡KeyLengthºÍValueLength£ºÁ½¸ö¹Ì¶¨µÄ³¤¶È£¬·Ö±ð´ú±íKeyºÍValueµÄ³¤¶È ¡¡¡¡Key²¿·Ö£ºRow LengthÊÇ¹Ì¶¨³¤¶ÈµÄÊýÖµ£¬±íÊ¾RowKeyµÄ³¤¶È£¬Row ¾ÍÊÇRowKey ¡¡¡¡Column Family LengthÊÇ¹Ì¶¨³¤¶ÈµÄÊýÖµ£¬±íÊ¾FamilyµÄ³¤¶È ¡¡¡¡½Ó×Å¾ÍÊÇColumn Family£¬ÔÙ½Ó×ÅÊÇQualifier£¬È»ºóÊÇÁ½¸ö¹Ì¶¨³¤¶ÈµÄÊýÖµ£¬±íÊ¾Time StampºÍKey Type£¨Put/Delete£© ¡¡¡¡Value²¿·ÖÃ»ÓÐÕâÃ´¸´ÔÓµÄ½á¹¹£¬¾ÍÊÇ´¿´âµÄ¶þ½øÖÆÊý¾ÝHLog File¡¡¡¡https://images2018.cnblogs.com/blog/1217276/201805/1217276-20180503010301359-528531120.jpg¡¡¡¡HLogÎÄ¼þ¾ÍÊÇÒ»¸öÆÕÍ¨µÄHadoop Sequence File£¬Sequence File µÄKeyÊÇHLogKey¶ÔÏó£¬HLogKeyÖÐ¼ÇÂ¼ÁËÐ´ÈëÊý¾ÝµÄ¹éÊôÐÅÏ¢£¬³ýÁËtableºÍregionÃû×ÖÍâ£¬Í¬Ê±»¹°üÀ¨ sequence numberºÍtimestamp£¬timestampÊÇ¡°Ð´ÈëÊ±¼ä¡±£¬sequence numberµÄÆðÊ¼ÖµÎª0£¬»òÕßÊÇ×î½üÒ»´Î´æÈëÎÄ¼þÏµÍ³ÖÐsequence number¡£ ¡¡¡¡HLog Sequece FileµÄValueÊÇHBaseµÄKeyValue¶ÔÏó£¬¼´¶ÔÓ¦HFileÖÐµÄKeyValue3.2 Ð´Á÷³Ì¡¡¡¡https://images2018.cnblogs.com/blog/1217276/201805/1217276-20180503001412746-1581550869.png¡¡¡¡1) ClientÍ¨¹ýZookeeperµÄµ÷¶È£¬ÏòRegionServer·¢³öÐ´Êý¾ÝÇëÇó£¬ÔÚRegionÖÐÐ´Êý¾Ý£»¡¡¡¡2) Êý¾Ý±»Ð´ÈëRegionµÄMemStore£¬ÖªµÀMemStore´ïµ½Ô¤Éè·§Öµ(¼´MemStoreÂú)£»¡¡¡¡3) MemStoreÖÐµÄÊý¾Ý±»Flush³ÉÒ»¸öStoreFile£»¡¡¡¡4) Ëæ×ÅStoreFileÎÄ¼þµÄ²»¶ÏÔö¶à£¬µ±ÆäÊýÁ¿Ôö³¤µ½Ò»¶¨·§Öµºó£¬´¥·¢CompactºÏ²¢²Ù×÷£¬½«¶à¸öStoreFileºÏ²¢³ÉÒ»¸öStoreFile£¬Í¬Ê±½øÐÐ°æ±¾ºÏ²¢ºÍÊý¾ÝÉ¾³ý£»¡¡¡¡5) StoreFilesÍ¨¹ý²»¶ÏµÄCompactºÏ²¢²Ù×÷£¬Öð²½ÐÎ³ÉÔ½À´Ô½´óµÄStoreFile£»¡¡¡¡6) µ¥¸öStoreFile´óÐ¡³¬¹ýÒ»¶¨·§Öµºó£¬´¥·¢Split²Ù×÷£¬°Ñµ±Ç°Region Split³É2¸öÐÂµÄRegion¡£¸¸Region»áÏÂÏß£¬ÐÂSplit³öµÄ2¸ö×ÓRegion»á±»HMaster·ÖÅäµ½ÏàÓ¦µÄRegionServerÉÏ£¬Ê¹µÃÔÏÈ1¸öRegionµÄÑ¹Á¦µÃÒÔ·ÖÁ÷µ½2¸öRegionÉÏ¡£¡¡¡¡¿ÉÒÔ¿´³öHBaseÖ»ÓÐÔöÌíÊý¾Ý£¬ËùÓÐµÄ¸üÐÂºÍÉ¾³ý²Ù×÷¶¼ÊÇÔÚºóÐøµÄCompactÀú³ÌÖÐ¾ÙÐÐµÄ£¬Ê¹µÃÓÃ»§µÄÐ´²Ù×÷Ö»Òª½øÈëÄÚ´æ¾Í¿ÉÒÔÁ¢¿Ì·µ»Ø£¬ÊµÏÖÁËHBase I/OµÄ¸ßÐÔÄÜ¡£3.3 ¶ÁÁ÷³Ì¡¡¡¡1) Client·ÃÎÊZookeeper£¬²éÕÒ-ROOT-±í£¬»ñÈ¡.META.±íÐÅÏ¢£»¡¡¡¡2) ´Ó.META.±í²éÕÒ£¬»ñÈ¡´æ·ÅÄ¿±êÊý¾ÝµÄRegionÐÅÏ¢£¬´Ó¶øÕÒµ½¶ÔÓ¦µÄRegionServer£»¡¡¡¡3) Í¨¹ýRegionServer»ñÈ¡ÐèÒª²éÕÒµÄÊý¾Ý£»¡¡¡¡4) RegionServerµÄÄÚ´æ·ÖÎªMemStoreºÍBlockCacheÁ½²¿·Ö£¬MemStoreÖ÷ÒªÓÃÓÚÐ´Êý¾Ý£¬BlockCacheÖ÷ÒªÓÃÓÚ¶ÁÊý¾Ý¡£¶ÁÇëÇóÏÈµ½MemStoreÖÐ²éÊý¾Ý£¬²é²»µ½¾Íµ½BlockCacheÖÐ²é£¬ÔÙ²é²»µ½¾Í»áµ½StoreFileÉÏ¶Á£¬²¢°Ñ¶ÁµÄ½á¹û·ÅÈëBlockCache¡£¡¡¡¡Ñ°Ö·¹ý³Ì£ºclient¡ª>Zookeeper¡ª>ROOT±í¡ª>.META. ±í¡ª>RegionServer¡ª>Region¡ª>client4. HBASEÃüÁî4.1 namespace¸ÅÊö¡¡¡¡ÔÚHBaseÖÐ£¬namespaceÃüÃû¿Õ¼äÖ¸¶ÔÒ»×é±íµÄÂß¼·Ö×é£¬ÀàËÆRDBMSÖÐµÄdatabase£¬·½±ã¶Ô±íÔÚÒµÎñÉÏ»®·Ö¡£Apache HBase´Ó0.98.0£¬0.95.2Á½¸ö°æ±¾¿ªÊ¼Ö§³Önamespace¼¶±ðµÄÊÚÈ¨²Ù×÷£¬HBaseÈ«¾Ö¹ÜÀíÔ±¿ÉÒÔ´´½¨¡¢ÐÞ¸ÄºÍ»ØÊÕnamespaceµÄÊÚÈ¨¡£¡¡¡¡HBaseÏµÍ³Ä¬ÈÏ¶¨ÒåÁËÁ½¸öÈ±Ê¡µÄnamespace£º
[*]hbase£ºÏµÍ³ÄÚ½¨±í£¬°üÀ¨namespaceºÍmeta±í
[*]default£ºÓÃ»§½¨±íÊ±Î´Ö¸¶¨namespaceµÄ±í¶¼´´½¨ÔÚ´Ë¡¡¡¡

4.2 ÃüÁîµÄ½øÍË1¡¢hbaseÌá¹©ÁËÒ»¸öshellµÄÖÕ¶Ë¸øÓÃ»§½»»¥hbase shellhttps://images2018.cnblogs.com/blog/1217276/201804/1217276-20180412223447617-1196334871.png2¡¢Èç¹ûÍË³öÖ´ÐÐquitÃüÁîhttps://images2018.cnblogs.com/blog/1217276/201804/1217276-20180412223750135-1760972050.png4.3 »ù±¾²Ù×÷ÃüÁî
Ãû³ÆÃüÁî±í´ïÊ½
²é¿´hbase×´Ì¬status
´´½¨namespacecreate_namespace 'ÃüÃû¿Õ¼äÃû³Æ'
É¾³ýnamespacedrop_namespace 'ÃüÃû¿Õ¼äÃû³Æ'
²é¿´namespacedescribe_namespace 'ÃüÃû¿Õ¼äÃû³Æ'
ÁÐ³öËùÓÐnamespacelist_namespace
ÔÚnamespaceÏÂ´´½¨±ícreate 'ÃüÃû¿Õ¼äÃû³Æ:±íÃû', 'ÁÐ×åÃû1'
²é¿´namespaceÏÂµÄ±ílist_namespace_tables 'ÃüÃû¿Õ¼äÃû³Æ'
´´½¨±í£¬Ä¬ÈÏÃüÃû¿Õ¼äÎªdefaultcreate '±íÃû','ÁÐ×åÃû1','ÁÐ×åÃû2','ÁÐ×åÃûN'
²é¿´ËùÓÐ±ílist
ÃèÊö±ídescribe '±íÃû'
ÅÐ¶Ï±í´æÔÚexists '±íÃû'
ÅÐ¶ÏÊÇ·ñ½ûÓÃÆôÓÃ±íis_enabled '±íÃû'
is_disabled '±íÃû'
Ìí¼Ó¼ÇÂ¼put '±íÃû','rowkey','ÁÐ×å£ºÁÐ'£¬'Öµ'
²é¿´¼ÇÂ¼rowkeyÏÂµÄËùÓÐÊý¾Ýget '±íÃû','rowkey'
²é¿´ËùÓÐ¼ÇÂ¼scan '±íÃû'
²é¿´±íÖÐµÄ¼ÇÂ¼×ÜÊýcount '±íÃû'
»ñÈ¡Ä³¸öÁÐ×åget'±íÃû','rowkey','ÁÐ×å£ºÁÐ'
»ñÈ¡Ä³¸öÁÐ×åµÄÄ³¸öÁÐget '±íÃû','rowkey','ÁÐ×å£ºÁÐ'
¼ÆËã±íµÄÐÐÊýÁ¿count '±íÃû'
É¾³ý¼ÇÂ¼delete '±íÃû','ÐÐÃû','ÁÐ×å£ºÁÐ'
É¾³ýÕûÐÐdeleteall '±íÃû','rowkey'
É¾³ýÒ»ÕÅ±íÏÈÒªÆÁ±Î¸Ã±í£¬²ÅÄÜ¶Ô¸Ã±í½øÐÐÉ¾³ý
µÚÒ»²½ disable '±íÃû'£¬µÚ¶þ²½ drop '±íÃû'
Çå¿Õ±ítruncate '±íÃû'
²é¿´Ä³¸ö±íÄ³¸öÁÐÖÐËùÓÐÊý¾Ýscan '±íÃû',{COLUMNS=>'ÁÐ×åÃû£ºÁÐÃû'}
¸üÐÂ¼ÇÂ¼¾ÍÊÇÖØÐÂÒ»±é£¬½øÐÐ¸²¸Ç£¬hbaseÃ»ÓÐÐÞ¸Ä£¬¶¼ÊÇ×·¼Ó
¾ßÌåÊµÀý£º1¡¢²é¿´HBaseÔËÐÐ×´Ì¬statushttps://images2018.cnblogs.com/blog/1217276/201804/1217276-20180413111151431-318623810.png2¡¢´´½¨±ícreate <table>,{NAME => <family>, VERSIONS => <VERSIONS>}´´½¨Ò»¸öUser±í£¬²¢ÇÒÓÐÒ»¸öinfoÁÐ×å https://images2018.cnblogs.com/blog/1217276/201804/1217276-20180413113824492-774805746.png3¡¢²é¿´ËùÓÐ±ílist https://images2018.cnblogs.com/blog/1217276/201804/1217276-20180413114007139-611606791.png4¡¢ÃèÊö±íÏêÇédescribe 'User'https://images2018.cnblogs.com/blog/1217276/201804/1217276-20180413121044733-2083100343.png5¡¢ÅÐ¶Ï±íÊÇ·ñ´æÔÚ exists'User'https://images2018.cnblogs.com/blog/1217276/201804/1217276-20180413121349423-1333153437.png6¡¢ÆôÓÃ»ò½ûÓÃ±í is_disabled'User' is_enabled'User'https://images2018.cnblogs.com/blog/1217276/201804/1217276-20180413121603237-805176516.png7¡¢Ìí¼Ó¼ÇÂ¼£¬¼´²åÈëÊý¾Ý£¬Óï·¨£ºput <table>,<rowkey>,<family:column>,<value>https://images2018.cnblogs.com/blog/1217276/201804/1217276-20180413122020453-914441331.png8¡¢¸ù¾ÝrowKey²éÑ¯Ä³¸ö¼ÇÂ¼£¬Óï·¨£ºget <table>,<rowkey>,[<family:column>, ...]https://images2018.cnblogs.com/blog/1217276/201804/1217276-20180413122538312-470099930.png9¡¢²éÑ¯ËùÓÐ¼ÇÂ¼£¬Óï·¨£ºscan <table>,{COLUMNS=>, LIMIT => num}É¨ÃèËùÓÐ¼ÇÂ¼ https://images2018.cnblogs.com/blog/1217276/201804/1217276-20180413122934856-486440430.pngÉ¨ÃèÇ°2Ìõhttps://images2018.cnblogs.com/blog/1217276/201804/1217276-20180413123206775-1739846948.png·¶Î§²éÑ¯https://images2018.cnblogs.com/blog/1217276/201804/1217276-20180413123602241-1128643343.pngÁíÍâ£¬»¹¿ÉÒÔÌí¼ÓTIMERANGEºÍFILTERµÈ¸ß¼¶¹¦ÄÜ£¬STARTROW¡¢ENDROW±ØÐë´óÐ´£¬·ñÔò±¨´í£¬²éÑ¯½á¹û²»°üº¬µÈÓÚENDROWµÄ½á¹û¼¯¡£10¡¢Í³¼Æ±í¼ÇÂ¼Êý£¬Óï·¨£ºcount <table>, {INTERVAL => intervalNum£¬CACHE => cacheNum} INTERVALÉèÖÃ¶àÉÙÐÐÏÔÊ¾Ò»´Î¼°¶ÔÓ¦µÄrowkey£¬Ä¬ÈÏ1000£»CACHEÃ¿´ÎÈ¥È¡µÄ»º´æÇø´óÐ¡£¬Ä¬ÈÏÊÇ10£¬µ÷Õû¸Ã²ÎÊý¿ÉÌá¸ß²éÑ¯ËÙ¶È¡£https://images2018.cnblogs.com/blog/1217276/201804/1217276-20180413124218237-665630801.png11¡¢É¾³ýÉ¾³ýÁÐhttps://images2018.cnblogs.com/blog/1217276/201804/1217276-20180413124525782-2069077254.pngÉ¾³ýÕûÐÐhttps://images2018.cnblogs.com/blog/1217276/201804/1217276-20180413124730351-995833036.pngÉ¾³ý±íÖÐËùÓÐÊý¾Ýhttps://images2018.cnblogs.com/blog/1217276/201804/1217276-20180413124844290-2067922262.png12¡¢½ûÓÃ»òÆôÓÃ±í½ûÓÃ±íhttps://images2018.cnblogs.com/blog/1217276/201804/1217276-20180413125325416-599912303.pngÆôÓÃ±íhttps://images2018.cnblogs.com/blog/1217276/201804/1217276-20180413125433862-2123274653.png12¡¢É¾³ý±íÉ¾³ýÇ°£¬±ØÐëÏÈdisable https://images2018.cnblogs.com/blog/1217276/201804/1217276-20180413125616137-288855577.png4.4 ÅúÁ¿ÃüÁî4.4.1 bulkload bulkloadÎªhbaseµÄÅúÁ¿²åÈëÃüÁî£¬Ó¦ÓÃÓÚ´óÊý¾ÝÁ¿µÄ²åÈë£¬Ã»ÓÐÐÔÄÜÎÊÌâhbase org.apache.hadoop.hbase.mapreduce.LoadIncrementalHFiles \ -Dhbase.mapreduce.bulkload.max.hfiles.perRegion.perFamily=1024 \ hdfs:///hfile_path \ hbase_namespace:table_name
4.4.2 bulkloadÓ¦ÓÃ ÒµÎñ³¡¾°£ºHiveÀëÏß¼ÆËãºÃµÄÊý¾Ý£¬ÐèÒªÍ¬²½µ½HBase¹©ÔÚÏßÒµÎñ²éÑ¯£¬Ë¼Â·ÊÇÓÃHBase×Ô´øµÄImportTsv¹¤¾ß¡£HiveÅÜÅú£º¡¡¡¡½¨±íÓï¾ä£¬ÒªÓÃÎÄ±¾¸ñÊ½£¬¼´Tsv¸ñÊ½£¬·Ö¸î·û¿ÉÒÔ×Ô¼º¶¨Òå£ºhttps://common.cnblogs.com/images/copycode.gif
CREATE TABLE IF NOT EXISTS tableA( rowkey STRING, ...)PARTITIONED BY (dt STRING)-- format: 2020-07-28ROW FORMAT DELIMITEDFIELDS TERMINATED BY '\t'LINES TERMINATED BY '\n'STORED AS TEXTFILE;https://common.cnblogs.com/images/copycode.gif

¡¡¡¡ÅÜÅúÓï¾ä£¬×¢ÒâÉèÖÃ²»Òªcompress£¬·ñÔòImportTsv¹¤¾ßÎÞ·¨Ê¶±ðSET hive.exec.compress.output=false;INSERT OVERWRITE TABLE tableAPARTITION( tx_date = \"$CALC_DATE\" )SELECT ..
Éú³ÉÖÐ¼äµÄHFilehttps://common.cnblogs.com/images/copycode.gif
hbase --config config_dir org.apache.hadoop.hbase.mapreduce.ImportTsv \ -Dmapreduce.job.queuename=queue \ -Dimporttsv.bulk.output=hdfs:///hfile_path \ -Dimporttsv.columns="HBASE_ROW_KEY,column_family:column_name.." \ hbase_namespace:table_name \ hdfs://hive_table_dirhttps://common.cnblogs.com/images/copycode.gif

ËµÃ÷£ºconfig_dirÊÇhbaseµÄÅäÖÃÄ¿Â¼£¬ÀïÃæ°üº¬hbase-site.xml£¬Õâ¸ö²½ÖèImportTsv»áÈ¥¶ÁÈ¡hive_table_dirÖÐµÄÎÄ¼þ£¬²¢·ÖÎöhbase tableµÄregion·Ö²¼£¬Éú³É¶ÔÓ¦regionµÄhfile£¬·Åµ½hfile_pathÖÐbulkloadhbase --config config_dir org.apache.hadoop.hbase.mapreduce.LoadIncrementalHFiles \ hdfs:///hfile_path \ hbase_namespace:table_name
ËµÃ÷£º
[*]Hive±í±ØÐëÊÇ´ø·Ö¸ô·ûµÄÎÄ±¾¸ñÊ½£¬¶øÇÒ²»ÄÜÑ¹Ëõ£¨±ÈÈçÆôÓÃÁËmapreduceµÄoutput snappyÑ¹ËõÒ²²»ÐÐ£©
[*]ImportTsv¿ÉÒÔÖ±½ÓÒ»ÌõÌõ²åÈëhbase£¬ÕâÊ±mapper½âÎöÒ»Ìõ£¬¾Í²åÈëÒ»Ìõ£¬Ã»ÓÐreduce½×¶Î£»Ïà±Èbulkload£¬´óÅúÁ¿Êý¾ÝÐÔÄÜ²»ºÃ
[*]bulkloadµÄÓÅµãÊÇ¿ì£¬Éú³ÉµÄhfileÖ±½Ó×¢²áµ½region server£¬Êý¾Ý¶ÔÓ¦ÓÃÁ¢¼´¿É¼û£¬Ã»ÓÐwal log£¬Ã»ÓÐflush£»¡¡¡¡

×Ü½á¡¾²Î¿¼×ÊÁÏ¡¿https://www.cnblogs.com/cenyuhai/p/3708135.htmlhttps://blog.csdn.net/liutong123987/article/details/79377327 https://www.cnblogs.com/Richardzhu/p/3435568.html µ¥¶ÀÆô¶¯secondarynamenode£¬¸¨ÖúnamenodeµÄÔªÊý¾ÝºÏ²¢https://blog.csdn.net/maligebazi/article/details/79952459 hbase ÃüÁîÏê½âÖ®namespaceÓëtablehttps://segmentfault.com/a/1190000011616473?utm_source=tag-newest Hive Êý¾Ýµ¼Èë HBase

Ò³: [1]

168´óÊý¾Ý's Archiver

HBase»ù±¾¸ÅÄîÓë»ù±¾Ê¹ÓÃ