FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE4366, 383 aa 1>>>pF1KE4366 383 - 383 aa - 383 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.7128+/-0.000876; mu= 14.2735+/- 0.052 mean_var=65.6082+/-13.600, 0's: 0 Z-trim(105.8): 26 B-trim: 232 in 1/49 Lambda= 0.158342 statistics sampled from 8599 (8616) to 8599 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.648), E-opt: 0.2 (0.265), width: 16 Scan time: 2.780 The best scores are: opt bits E(32554) CCDS1435.1 CHI3L1 gene_id:1116|Hs108|chr1 ( 383) 2605 604.0 7.3e-173 CCDS1436.1 CHIT1 gene_id:1118|Hs108|chr1 ( 466) 1389 326.2 3.7e-89 CCDS30802.1 CHI3L2 gene_id:1117|Hs108|chr1 ( 390) 1376 323.2 2.4e-88 CCDS30803.1 CHI3L2 gene_id:1117|Hs108|chr1 ( 380) 1336 314.1 1.3e-85 CCDS41368.1 CHIA gene_id:27159|Hs108|chr1 ( 476) 1309 307.9 1.2e-83 CCDS41367.1 CHI3L2 gene_id:1117|Hs108|chr1 ( 311) 1133 267.7 1e-71 CCDS834.1 OVGP1 gene_id:5016|Hs108|chr1 ( 678) 1130 267.1 3.3e-71 CCDS58057.1 CHIT1 gene_id:1118|Hs108|chr1 ( 447) 999 237.1 2.3e-62 CCDS832.1 CHIA gene_id:27159|Hs108|chr1 ( 368) 905 215.6 5.7e-56 CCDS58017.1 CHIA gene_id:27159|Hs108|chr1 ( 315) 745 179.0 5e-45 >>CCDS1435.1 CHI3L1 gene_id:1116|Hs108|chr1 (383 aa) initn: 2605 init1: 2605 opt: 2605 Z-score: 3216.9 bits: 604.0 E(32554): 7.3e-173 Smith-Waterman score: 2605; 100.0% identity (100.0% similar) in 383 aa overlap (1-383:1-383) 10 20 30 40 50 60 pF1KE4 MGVKASQTGFVVLVLLQCCSAYKLVCYYTSWSQYREGDGSCFPDALDRFLCTHIIYSFAN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 MGVKASQTGFVVLVLLQCCSAYKLVCYYTSWSQYREGDGSCFPDALDRFLCTHIIYSFAN 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE4 ISNDHIDTWEWNDVTLYGMLNTLKNRNPNLKTLLSVGGWNFGSQRFSKIASNTQSRRTFI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 ISNDHIDTWEWNDVTLYGMLNTLKNRNPNLKTLLSVGGWNFGSQRFSKIASNTQSRRTFI 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE4 KSVPPFLRTHGFDGLDLAWLYPGRRDKQHFTTLIKEMKAEFIKEAQPGKKQLLLSAALSA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 KSVPPFLRTHGFDGLDLAWLYPGRRDKQHFTTLIKEMKAEFIKEAQPGKKQLLLSAALSA 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE4 GKVTIDSSYDIAKISQHLDFISIMTYDFHGAWRGTTGHHSPLFRGQEDASPDRFSNTDYA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 GKVTIDSSYDIAKISQHLDFISIMTYDFHGAWRGTTGHHSPLFRGQEDASPDRFSNTDYA 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE4 VGYMLRLGAPASKLVMGIPTFGRSFTLASSETGVGAPISGPGIPGRFTKEAGTLAYYEIC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 VGYMLRLGAPASKLVMGIPTFGRSFTLASSETGVGAPISGPGIPGRFTKEAGTLAYYEIC 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE4 DFLRGATVHRILGQQVPYATKGNQWVGYDDQESVKSKVQYLKDRQLAGAMVWALDLDDFQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS14 DFLRGATVHRILGQQVPYATKGNQWVGYDDQESVKSKVQYLKDRQLAGAMVWALDLDDFQ 310 320 330 340 350 360 370 380 pF1KE4 GSFCGQDLRFPLTNAIKDALAAT ::::::::::::::::::::::: CCDS14 GSFCGQDLRFPLTNAIKDALAAT 370 380 >>CCDS1436.1 CHIT1 gene_id:1118|Hs108|chr1 (466 aa) initn: 1379 init1: 626 opt: 1389 Z-score: 1714.2 bits: 326.2 E(32554): 3.7e-89 Smith-Waterman score: 1389; 53.2% identity (80.5% similar) in 380 aa overlap (9-381:9-386) 10 20 30 40 50 60 pF1KE4 MGVKASQTGFVVLVLLQCCSAYKLVCYYTSWSQYREGDGSCFPDALDRFLCTHIIYSFAN ::.::... :: :::::.:.:.:::.:.. .: :: ::::.::.::. CCDS14 MVRSVAWAGFMVLLMIPWGSAAKLVCYFTNWAQYRQGEARFLPKDLDPSLCTHLIYAFAG 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE4 ISNDHIDTWEWNDVTLYGMLNTLKNRNPNLKTLLSVGGWNFGSQRFSKIASNTQSRRTFI ..: ...: :::: ::: .: ::. ::.:::::..::::::.:.:. .......:.::. CCDS14 MTNHQLSTTEWNDETLYQEFNGLKKMNPKLKTLLAIGGWNFGTQKFTDMVATANNRQTFV 70 80 90 100 110 120 130 140 150 160 170 pF1KE4 KSVPPFLRTHGFDGLDLAWLYPGRR-----DKQHFTTLIKEMKAEFIKEAQP-GKKQLLL .:. ::: ..:::::: : ::: . ::..::::.... : .::: ::..::: CCDS14 NSAIRFLRKYSFDGLDLDWEYPGSQGSPAVDKERFTTLVQDLANAFQQEAQTSGKERLLL 130 140 150 160 170 180 180 190 200 210 220 230 pF1KE4 SAALSAGKVTIDSSYDIAKISQHLDFISIMTYDFHGAWRGTTGHHSPLFRGQEDASPDRF :::. ::.. .:..:.. ::.:.:::...:.:::::.:. .:::.:::.. ::... CCDS14 SAAVPAGQTYVDAGYEVDKIAQNLDFVNLMAYDFHGSWEKVTGHNSPLYKRQEESGAAAS 190 200 210 220 230 240 240 250 260 270 280 290 pF1KE4 SNTDYAVGYMLRLGAPASKLVMGIPTFGRSFTLASS-ETGVGAPISGPGIPGRFTKEAGT :.: :: :. :.:::::..:.::.::::::::: .: :::: .: : :: ::::.: CCDS14 LNVDAAVQQWLQKGTPASKLILGMPTYGRSFTLASSSDTRVGAPATGSGTPGPFTKEGGM 250 260 270 280 290 300 300 310 320 330 340 350 pF1KE4 LAYYEICDFLRGATVHRILGQQVPYATKGNQWVGYDDQESVKSKVQYLKDRQLAGAMVWA :::::.:.. .::: .:: :.::: . :::::.:: :: :.::.:::.. :.:::::: CCDS14 LAYYEVCSW-KGATKQRIQDQKVPYIFRDNQWVGFDDVESFKTKVSYLKQKGLGGAMVWA 310 320 330 340 350 360 370 380 pF1KE4 LDLDDFQGSFCGQDLRFPLTNAIKDALAAT :::::: : :.: :.:: ..... :. CCDS14 LDLDDFAGFSCNQG-RYPLIQTLRQELSLPYLPSGTPELEVPKPGQPSEPEHGPSPGQDT 360 370 380 390 400 410 >>CCDS30802.1 CHI3L2 gene_id:1117|Hs108|chr1 (390 aa) initn: 1358 init1: 656 opt: 1376 Z-score: 1699.5 bits: 323.2 E(32554): 2.4e-88 Smith-Waterman score: 1376; 51.2% identity (80.0% similar) in 385 aa overlap (1-382:6-389) 10 20 30 40 50 pF1KE4 MGVKASQTGFVVLVLLQCCSAYKLVCYYTSWSQYREGDGSCFPDALDRFLCTHII : :. .: :::.::: ::::::::.:.::: :. :. :. .: :::.:.: CCDS30 MGATTMDQKSLWAGVVVLLLLQGGSAYKLVCYFTNWSQDRQEPGKFTPENIDPFLCSHLI 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE4 YSFANISNDHIDTWEWNDVTLYGMLNTLKNRNPNLKTLLSVGGWNFGSQRFSKIASNTQS ::::.: :... . ..: :: .:.::..::.:: :::.::. :::. : ..... : CCDS30 YSFASIENNKVIIKDKSEVMLYQTINSLKTKNPKLKILLSIGGYLFGSKGFHPMVDSSTS 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE4 RRTFIKSVPPFLRTHGFDGLDLAWLYPGRRDKQHFTTLIKEMKAEFIKE-AQPGKKQLLL : ::.:. :::.:.:::::..:.:: .... :::.::.:. : :. .. :..::: CCDS30 RLEFINSIILFLRNHNFDGLDVSWIYPDQKENTHFTVLIHELAEAFQKDFTKSTKERLLL 130 140 150 160 170 180 180 190 200 210 220 230 pF1KE4 SAALSAGKVTIDSSYDIAKISQHLDFISIMTYDFHGAWRGT--TGHHSPLFRGQEDASPD .:..:::. ::.::.. :... ::::.....::::.:. :::.::: .: .: .:. CCDS30 TAGVSAGRQMIDNSYQVEKLAKDLDFINLLSFDFHGSWEKPLITGHNSPLSKGWQDRGPS 190 200 210 220 230 240 240 250 260 270 280 290 pF1KE4 RFSNTDYAVGYMLRLGAPASKLVMGIPTFGRSFTLASSETGVGAPISGPGIPGRFTKEAG . :..::::: .. : :. :.::::::.:.::::::.:: :::: :::: : .:. .: CCDS30 SYYNVEYAVGYWIHKGMPSEKVVMGIPTYGHSFTLASAETTVGAPASGPGAAGPITESSG 250 260 270 280 290 300 300 310 320 330 340 350 pF1KE4 TLAYYEICDFLRGATVHRILGQQVPYATKGNQWVGYDDQESVKSKVQYLKDRQLAGAMVW :::::::.::.:: . :. ::::::.:::::::::: .:...:::.::. .:.:::.: CCDS30 FLAYYEICQFLKGAKITRLQDQQVPYAVKGNQWVGYDDVKSMETKVQFLKNLNLGGAMIW 310 320 330 340 350 360 360 370 380 pF1KE4 ALDLDDFQGSFCGQDLRFPLTNAIKDALAAT ..:.::: :. :.: .::..:.: .:.. CCDS30 SIDMDDFTGKSCNQG-PYPLVQAVKRSLGSL 370 380 390 >>CCDS30803.1 CHI3L2 gene_id:1117|Hs108|chr1 (380 aa) initn: 1318 init1: 656 opt: 1336 Z-score: 1650.3 bits: 314.1 E(32554): 1.3e-85 Smith-Waterman score: 1336; 51.4% identity (80.9% similar) in 366 aa overlap (20-382:15-379) 10 20 30 40 50 60 pF1KE4 MGVKASQTGFVVLVLLQCCSAYKLVCYYTSWSQYREGDGSCFPDALDRFLCTHIIYSFAN ::::::::.:.::: :. :. :. .: :::.:.:::::. CCDS30 MGATTMDQKSLWAGSAYKLVCYFTNWSQDRQEPGKFTPENIDPFLCSHLIYSFAS 10 20 30 40 50 70 80 90 100 110 120 pF1KE4 ISNDHIDTWEWNDVTLYGMLNTLKNRNPNLKTLLSVGGWNFGSQRFSKIASNTQSRRTFI : :... . ..: :: .:.::..::.:: :::.::. :::. : ..... :: :: CCDS30 IENNKVIIKDKSEVMLYQTINSLKTKNPKLKILLSIGGYLFGSKGFHPMVDSSTSRLEFI 60 70 80 90 100 110 130 140 150 160 170 pF1KE4 KSVPPFLRTHGFDGLDLAWLYPGRRDKQHFTTLIKEMKAEFIKE-AQPGKKQLLLSAALS .:. :::.:.:::::..:.:: .... :::.::.:. : :. .. :..:::.:..: CCDS30 NSIILFLRNHNFDGLDVSWIYPDQKENTHFTVLIHELAEAFQKDFTKSTKERLLLTAGVS 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE4 AGKVTIDSSYDIAKISQHLDFISIMTYDFHGAWRGT--TGHHSPLFRGQEDASPDRFSNT ::. ::.::.. :... ::::.....::::.:. :::.::: .: .: .:. . :. CCDS30 AGRQMIDNSYQVEKLAKDLDFINLLSFDFHGSWEKPLITGHNSPLSKGWQDRGPSSYYNV 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE4 DYAVGYMLRLGAPASKLVMGIPTFGRSFTLASSETGVGAPISGPGIPGRFTKEAGTLAYY .::::: .. : :. :.::::::.:.::::::.:: :::: :::: : .:. .: :::: CCDS30 EYAVGYWIHKGMPSEKVVMGIPTYGHSFTLASAETTVGAPASGPGAAGPITESSGFLAYY 240 250 260 270 280 290 300 310 320 330 340 350 pF1KE4 EICDFLRGATVHRILGQQVPYATKGNQWVGYDDQESVKSKVQYLKDRQLAGAMVWALDLD :::.::.:: . :. ::::::.:::::::::: .:...:::.::. .:.:::.:..:.: CCDS30 EICQFLKGAKITRLQDQQVPYAVKGNQWVGYDDVKSMETKVQFLKNLNLGGAMIWSIDMD 300 310 320 330 340 350 360 370 380 pF1KE4 DFQGSFCGQDLRFPLTNAIKDALAAT :: :. :.: .::..:.: .:.. CCDS30 DFTGKSCNQG-PYPLVQAVKRSLGSL 360 370 380 >>CCDS41368.1 CHIA gene_id:27159|Hs108|chr1 (476 aa) initn: 1262 init1: 542 opt: 1309 Z-score: 1615.3 bits: 307.9 E(32554): 1.2e-83 Smith-Waterman score: 1309; 51.2% identity (77.2% similar) in 381 aa overlap (8-380:8-387) 10 20 30 40 50 60 pF1KE4 MGVKASQTGFVVLVLLQCCSAYKLVCYYTSWSQYREGDGSCFPDALDRFLCTHIIYSFAN ::.:... :: :::.:.::.:.:.::: : : .:: .: ::::.::.::. CCDS41 MTKLILLTGLVLILNLQLGSAYQLTCYFTNWAQYRPGLGRFMPDNIDPCLCTHLIYAFAG 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE4 ISNDHIDTWEWNDVTLYGMLNTLKNRNPNLKTLLSVGGWNFGSQRFSKIASNTQSRRTFI .:..: : :::::::: .: :::.: .:::::..::::::. :. ..:. ..:.::: CCDS41 RQNNEITTIEWNDVTLYQAFNGLKNKNSQLKTLLAIGGWNFGTAPFTAMVSTPENRQTFI 70 80 90 100 110 120 130 140 150 160 170 pF1KE4 KSVPPFLRTHGFDGLDLAWLYPGRR-----DKQHFTTLIKEMKAEFIKEA-QPGKKQLLL :: ::: . :::::. : ::: : ::. ::.:..::. : .:: : .: .:.. CCDS41 TSVIKFLRQYEFDGLDFDWEYPGSRGSPPQDKHLFTVLVQEMREAFEQEAKQINKPRLMV 130 140 150 160 170 180 180 190 200 210 220 230 pF1KE4 SAALSAGKVTIDSSYDIAKISQHLDFISIMTYDFHGAWRGTTGHHSPLFRGQEDASPDRF .::..:: .:.:.:.: ..::.::.: .::::.::.:.: ::..:::.. :.. . . CCDS41 TAAVAAGISNIQSGYEIPQLSQYLDYIHVMTYDLHGSWEGYTGENSPLYKYPTDTGSNAY 190 200 210 220 230 240 240 250 260 270 280 290 pF1KE4 SNTDYAVGYMLRLGAPASKLVMGIPTFGRSFTLAS-SETGVGAPISGPGIPGRFTKEAGT :.::...: :::: ::..:.::.:..: :.. :.::.::: :: : : ..::.: CCDS41 LNVDYVMNYWKDNGAPAEKLIVGFPTYGHNFILSNPSNTGIGAPTSGAGPAGPYAKESGI 250 260 270 280 290 300 300 310 320 330 340 350 pF1KE4 LAYYEICDFLR-GATVHRILGQQVPYATKGNQWVGYDDQESVKSKVQYLKDRQLAGAMVW :::::: ::. ::: :.:::: .:: :::::. .: :.:.:: ...::::: CCDS41 WAYYEICTFLKNGATQGWDAPQEVPYAYQGNVWVGYDNIKSFDIKAQWLKHNKFGGAMVW 310 320 330 340 350 360 360 370 380 pF1KE4 ALDLDDFQGSFCGQDLRFPLTNAIKDALAAT :.::::: :.::.: .::: ...: :: CCDS41 AIDLDDFTGTFCNQG-KFPLISTLKKALGLQSASCTAPAQPIEPITAAPSGSGNGSGSSS 370 380 390 400 410 >>CCDS41367.1 CHI3L2 gene_id:1117|Hs108|chr1 (311 aa) initn: 1135 init1: 656 opt: 1133 Z-score: 1401.0 bits: 267.7 E(32554): 1e-71 Smith-Waterman score: 1133; 51.6% identity (81.6% similar) in 310 aa overlap (76-382:2-310) 50 60 70 80 90 100 pF1KE4 LDRFLCTHIIYSFANISNDHIDTWEWNDVTLYGMLNTLKNRNPNLKTLLSVGGWNFGSQR :: .:.::..::.:: :::.::. :::. CCDS41 MLYQTINSLKTKNPKLKILLSIGGYLFGSKG 10 20 30 110 120 130 140 150 160 pF1KE4 FSKIASNTQSRRTFIKSVPPFLRTHGFDGLDLAWLYPGRRDKQHFTTLIKEMKAEFIKE- : ..... :: ::.:. :::.:.:::::..:.:: .... :::.::.:. : :. CCDS41 FHPMVDSSTSRLEFINSIILFLRNHNFDGLDVSWIYPDQKENTHFTVLIHELAEAFQKDF 40 50 60 70 80 90 170 180 190 200 210 220 pF1KE4 AQPGKKQLLLSAALSAGKVTIDSSYDIAKISQHLDFISIMTYDFHGAWRGT--TGHHSPL .. :..:::.:..:::. ::.::.. :... ::::.....::::.:. :::.::: CCDS41 TKSTKERLLLTAGVSAGRQMIDNSYQVEKLAKDLDFINLLSFDFHGSWEKPLITGHNSPL 100 110 120 130 140 150 230 240 250 260 270 280 pF1KE4 FRGQEDASPDRFSNTDYAVGYMLRLGAPASKLVMGIPTFGRSFTLASSETGVGAPISGPG .: .: .:. . :..::::: .. : :. :.::::::.:.::::::.:: :::: :::: CCDS41 SKGWQDRGPSSYYNVEYAVGYWIHKGMPSEKVVMGIPTYGHSFTLASAETTVGAPASGPG 160 170 180 190 200 210 290 300 310 320 330 340 pF1KE4 IPGRFTKEAGTLAYYEICDFLRGATVHRILGQQVPYATKGNQWVGYDDQESVKSKVQYLK : .:. .: :::::::.::.:: . :. ::::::.:::::::::: .:...:::.:: CCDS41 AAGPITESSGFLAYYEICQFLKGAKITRLQDQQVPYAVKGNQWVGYDDVKSMETKVQFLK 220 230 240 250 260 270 350 360 370 380 pF1KE4 DRQLAGAMVWALDLDDFQGSFCGQDLRFPLTNAIKDALAAT . .:.:::.:..:.::: :. :.: .::..:.: .:.. CCDS41 NLNLGGAMIWSIDMDDFTGKSCNQG-PYPLVQAVKRSLGSL 280 290 300 310 >>CCDS834.1 OVGP1 gene_id:5016|Hs108|chr1 (678 aa) initn: 991 init1: 342 opt: 1130 Z-score: 1391.8 bits: 267.1 E(32554): 3.3e-71 Smith-Waterman score: 1130; 46.8% identity (73.4% similar) in 380 aa overlap (9-380:9-382) 10 20 30 40 50 60 pF1KE4 MGVKASQTGFVVLVLLQCCSAYKLVCYYTSWSQYREGDGSCFPDALDRFLCTHIIYSFAN :.:... . .:.:::::.:.:.. : : .: .: :: :::::.:..::. CCDS83 MWKLLLWVGLVLVLKHHDGAAHKLVCYFTNWAHSRPGPASILPHDLDPFLCTHLIFAFAS 10 20 30 40 50 60 70 80 90 100 110 pF1KE4 ISNDHIDTWEWNDVT-LYGMLNTLKNRNPNLKTLLSVGGWNFGSQRFSKIASNTQSRRTF ..:..: . . .: :: .: ::.:: .::::::.::::::..::. . :. .:. : CCDS83 MNNNQIVAKDLQDEKILYPEFNKLKERNRELKTLLSIGGWNFGTSRFTTMLSTFANREKF 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE4 IKSVPPFLRTHGFDGLDLAWLYPGRR-----DKQHFTTLIKEMKAEFIKEAQ-PGKKQLL : :: .:::: :::::: .:::: : :. : ::.:. : ::: . .:: CCDS83 IASVISLLRTHDFDGLDLFFLYPGLRGSPMHDRWTFLFLIEELLFAFRKEALLTMRPRLL 130 140 150 160 170 180 180 190 200 210 220 230 pF1KE4 LSAALSAGKVTIDSSYDIAKISQHLDFISIMTYDFHGAWRGTTGHHSPLFRGQEDASPDR ::::.:. ...:::. ... ::::....::.::.:. :::.:::: :: : CCDS83 LSAAVSGVPHIVQTSYDVRFLGRLLDFINVLSYDLHGSWERFTGHNSPLFSLPED--P-- 190 200 210 220 230 240 250 260 270 280 290 pF1KE4 FSNTDYAVGYMLRLGAPASKLVMGIPTFGRSFTL-ASSETGVGAPISGPGIPGRFTKEAG ... ::..: .::::. ::.:::::.::.: : .:..:. : ::. ::..::. : CCDS83 -KSSAYAMNYWRKLGAPSEKLIMGIPTYGRTFRLLKASKNGLQARAIGPASPGKYTKQEG 240 250 260 270 280 290 300 310 320 330 340 350 pF1KE4 TLAYYEICDFLRGATVHRILGQQVPYATKGNQWVGYDDQESVKSKVQYLKDRQLAGAMVW :::.:::.:. :: : : : ::::.::..:::::. : . :. ... ....::::: CCDS83 FLAYFEICSFVWGAKKHWIDYQYVPYANKGKEWVGYDNAISFSYKAWFIRREHFGGAMVW 300 310 320 330 340 350 360 370 380 pF1KE4 ALDLDDFQGSFCGQDLRFPLTNAIKDALAAT .::.:: .:.::: :::. ...: : CCDS83 TLDMDDVRGTFCGTG-PFPLVYVLNDILVRAEFSSTSLPQFWLSSAVNSSSTDPERLAVT 360 370 380 390 400 410 >>CCDS58057.1 CHIT1 gene_id:1118|Hs108|chr1 (447 aa) initn: 1253 init1: 626 opt: 999 Z-score: 1233.1 bits: 237.1 E(32554): 2.3e-62 Smith-Waterman score: 1229; 49.5% identity (75.5% similar) in 380 aa overlap (9-381:9-367) 10 20 30 40 50 60 pF1KE4 MGVKASQTGFVVLVLLQCCSAYKLVCYYTSWSQYREGDGSCFPDALDRFLCTHIIYSFAN ::.::... :: :::::.:.:.:::.:.. .: :: ::::.::.::. CCDS58 MVRSVAWAGFMVLLMIPWGSAAKLVCYFTNWAQYRQGEARFLPKDLDPSLCTHLIYAFAG 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE4 ISNDHIDTWEWNDVTLYGMLNTLKNRNPNLKTLLSVGGWNFGSQRFSKIASNTQSRRTFI ..: ...: :::: ::: .: :: . :. .......:.::. CCDS58 MTNHQLSTTEWNDETLYQEFNGLK-------------------KMFTDMVATANNRQTFV 70 80 90 100 130 140 150 160 170 pF1KE4 KSVPPFLRTHGFDGLDLAWLYPGRR-----DKQHFTTLIKEMKAEFIKEAQP-GKKQLLL .:. ::: ..:::::: : ::: . ::..::::.... : .::: ::..::: CCDS58 NSAIRFLRKYSFDGLDLDWEYPGSQGSPAVDKERFTTLVQDLANAFQQEAQTSGKERLLL 110 120 130 140 150 160 180 190 200 210 220 230 pF1KE4 SAALSAGKVTIDSSYDIAKISQHLDFISIMTYDFHGAWRGTTGHHSPLFRGQEDASPDRF :::. ::.. .:..:.. ::.:.:::...:.:::::.:. .:::.:::.. ::... CCDS58 SAAVPAGQTYVDAGYEVDKIAQNLDFVNLMAYDFHGSWEKVTGHNSPLYKRQEESGAAAS 170 180 190 200 210 220 240 250 260 270 280 290 pF1KE4 SNTDYAVGYMLRLGAPASKLVMGIPTFGRSFTLASS-ETGVGAPISGPGIPGRFTKEAGT :.: :: :. :.:::::..:.::.::::::::: .: :::: .: : :: ::::.: CCDS58 LNVDAAVQQWLQKGTPASKLILGMPTYGRSFTLASSSDTRVGAPATGSGTPGPFTKEGGM 230 240 250 260 270 280 300 310 320 330 340 350 pF1KE4 LAYYEICDFLRGATVHRILGQQVPYATKGNQWVGYDDQESVKSKVQYLKDRQLAGAMVWA :::::.:.. .::: .:: :.::: . :::::.:: :: :.::.:::.. :.:::::: CCDS58 LAYYEVCSW-KGATKQRIQDQKVPYIFRDNQWVGFDDVESFKTKVSYLKQKGLGGAMVWA 290 300 310 320 330 340 360 370 380 pF1KE4 LDLDDFQGSFCGQDLRFPLTNAIKDALAAT :::::: : :.: :.:: ..... :. CCDS58 LDLDDFAGFSCNQG-RYPLIQTLRQELSLPYLPSGTPELEVPKPGQPSEPEHGPSPGQDT 350 360 370 380 390 >>CCDS832.1 CHIA gene_id:27159|Hs108|chr1 (368 aa) initn: 858 init1: 315 opt: 905 Z-score: 1118.4 bits: 215.6 E(32554): 5.7e-56 Smith-Waterman score: 905; 49.3% identity (76.1% similar) in 280 aa overlap (109-380:1-279) 80 90 100 110 120 130 pF1KE4 MLNTLKNRNPNLKTLLSVGGWNFGSQRFSKIASNTQSRRTFIKSVPPFLRTHGFDGLDLA ..:. ..:.::: :: ::: . :::::. CCDS83 MVSTPENRQTFITSVIKFLRQYEFDGLDFD 10 20 30 140 150 160 170 180 190 pF1KE4 WLYPGRR-----DKQHFTTLIKEMKAEFIKEA-QPGKKQLLLSAALSAGKVTIDSSYDIA : ::: : ::. ::.:..::. : .:: : .: .:...::..:: .:.:.:.: CCDS83 WEYPGSRGSPPQDKHLFTVLVQEMREAFEQEAKQINKPRLMVTAAVAAGISNIQSGYEIP 40 50 60 70 80 90 200 210 220 230 240 250 pF1KE4 KISQHLDFISIMTYDFHGAWRGTTGHHSPLFRGQEDASPDRFSNTDYAVGYMLRLGAPAS ..::.::.: .::::.::.:.: ::..:::.. :.. . . :.::...: :::: CCDS83 QLSQYLDYIHVMTYDLHGSWEGYTGENSPLYKYPTDTGSNAYLNVDYVMNYWKDNGAPAE 100 110 120 130 140 150 260 270 280 290 300 310 pF1KE4 KLVMGIPTFGRSFTLAS-SETGVGAPISGPGIPGRFTKEAGTLAYYEICDFLR-GATVHR ::..:.::.:..: :.. :.::.::: :: : : ..::.: :::::: ::. ::: CCDS83 KLIVGFPTYGHNFILSNPSNTGIGAPTSGAGPAGPYAKESGIWAYYEICTFLKNGATQGW 160 170 180 190 200 210 320 330 340 350 360 370 pF1KE4 ILGQQVPYATKGNQWVGYDDQESVKSKVQYLKDRQLAGAMVWALDLDDFQGSFCGQDLRF :.:::: .:: :::::. .: :.:.:: ...::::::.::::: :.::.: .: CCDS83 DAPQEVPYAYQGNVWVGYDNIKSFDIKAQWLKHNKFGGAMVWAIDLDDFTGTFCNQG-KF 220 230 240 250 260 380 pF1KE4 PLTNAIKDALAAT :: ...: :: CCDS83 PLISTLKKALGLQSASCTAPAQPIEPITAAPSGSGNGSGSSSSGGSSGGSGFCAVRANGL 270 280 290 300 310 320 >>CCDS58017.1 CHIA gene_id:27159|Hs108|chr1 (315 aa) initn: 678 init1: 315 opt: 745 Z-score: 921.9 bits: 179.0 E(32554): 5e-45 Smith-Waterman score: 745; 49.3% identity (77.1% similar) in 227 aa overlap (157-380:1-226) 130 140 150 160 170 180 pF1KE4 LRTHGFDGLDLAWLYPGRRDKQHFTTLIKEMKAEFIKEA-QPGKKQLLLSAALSAGKVTI :. : .:: : .: .:...::..:: .: CCDS58 MREAFEQEAKQINKPRLMVTAAVAAGISNI 10 20 30 190 200 210 220 230 240 pF1KE4 DSSYDIAKISQHLDFISIMTYDFHGAWRGTTGHHSPLFRGQEDASPDRFSNTDYAVGYML .:.:.: ..::.::.: .::::.::.:.: ::..:::.. :.. . . :.::...: CCDS58 QSGYEIPQLSQYLDYIHVMTYDLHGSWEGYTGENSPLYKYPTDTGSNAYLNVDYVMNYWK 40 50 60 70 80 90 250 260 270 280 290 300 pF1KE4 RLGAPASKLVMGIPTFGRSFTLAS-SETGVGAPISGPGIPGRFTKEAGTLAYYEICDFLR :::: ::..:.::.:..: :.. :.::.::: :: : : ..::.: :::::: ::. CCDS58 DNGAPAEKLIVGFPTYGHNFILSNPSNTGIGAPTSGAGPAGPYAKESGIWAYYEICTFLK 100 110 120 130 140 150 310 320 330 340 350 360 pF1KE4 -GATVHRILGQQVPYATKGNQWVGYDDQESVKSKVQYLKDRQLAGAMVWALDLDDFQGSF ::: :.:::: .:: :::::. .: :.:.:: ...::::::.::::: :.: CCDS58 NGATQGWDAPQEVPYAYQGNVWVGYDNIKSFDIKAQWLKHNKFGGAMVWAIDLDDFTGTF 160 170 180 190 200 210 370 380 pF1KE4 CGQDLRFPLTNAIKDALAAT :.: .::: ...: :: CCDS58 CNQG-KFPLISTLKKALGLQSASCTAPAQPIEPITAAPSGSGNGSGSSSSGGSSGGSGFC 220 230 240 250 260 383 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sun Nov 6 02:02:06 2016 done: Sun Nov 6 02:02:06 2016 Total Scan time: 2.780 Total Display time: 0.040 Function used was FASTA [36.3.4 Apr, 2011]