FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE6425, 443 aa 1>>>pF1KE6425 443 - 443 aa - 443 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.4260+/-0.000982; mu= 16.5370+/- 0.059 mean_var=63.5706+/-12.614, 0's: 0 Z-trim(104.4): 31 B-trim: 51 in 1/49 Lambda= 0.160859 statistics sampled from 7841 (7871) to 7841 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.614), E-opt: 0.2 (0.242), width: 16 Scan time: 2.770 The best scores are: opt bits E(32554) CCDS5929.1 GALNTL5 gene_id:168391|Hs108|chr7 ( 443) 3012 707.9 4.9e-204 CCDS5930.1 GALNT11 gene_id:63917|Hs108|chr7 ( 608) 1472 350.6 2.5e-96 CCDS2199.1 GALNT13 gene_id:114805|Hs108|chr2 ( 556) 1106 265.7 8.5e-71 CCDS77472.1 GALNT13 gene_id:114805|Hs108|chr2 ( 561) 1106 265.7 8.6e-71 CCDS11915.1 GALNT1 gene_id:2589|Hs108|chr18 ( 559) 1089 261.7 1.3e-69 CCDS55860.1 GALNT4 gene_id:100528030|Hs108|chr12 ( 575) 1068 256.9 4e-68 CCDS53817.1 GALNT4 gene_id:8693|Hs108|chr12 ( 578) 1068 256.9 4e-68 CCDS1582.1 GALNT2 gene_id:2590|Hs108|chr1 ( 571) 1020 245.7 8.9e-65 CCDS34104.1 GALNTL6 gene_id:442117|Hs108|chr4 ( 601) 1018 245.3 1.3e-64 CCDS82742.1 GALNT15 gene_id:117248|Hs108|chr3 ( 617) 1014 244.3 2.5e-64 CCDS33711.1 GALNT15 gene_id:117248|Hs108|chr3 ( 639) 1014 244.3 2.6e-64 CCDS58705.1 GALNT14 gene_id:79623|Hs108|chr2 ( 532) 1008 242.9 5.8e-64 CCDS1773.2 GALNT14 gene_id:79623|Hs108|chr2 ( 552) 1008 242.9 6e-64 CCDS2203.1 GALNT5 gene_id:11227|Hs108|chr2 ( 940) 1006 242.6 1.3e-63 CCDS6737.1 GALNT12 gene_id:79695|Hs108|chr9 ( 581) 995 239.9 5e-63 CCDS32107.1 GALNT16 gene_id:57452|Hs108|chr14 ( 558) 988 238.3 1.5e-62 CCDS3815.1 GALNT7 gene_id:51809|Hs108|chr4 ( 657) 985 237.6 2.8e-62 CCDS58706.1 GALNT14 gene_id:79623|Hs108|chr2 ( 557) 973 234.8 1.7e-61 CCDS4325.1 GALNT10 gene_id:55568|Hs108|chr5 ( 603) 973 234.8 1.8e-61 CCDS2226.1 GALNT3 gene_id:2591|Hs108|chr2 ( 633) 968 233.7 4.2e-61 CCDS8813.1 GALNT6 gene_id:11226|Hs108|chr12 ( 622) 946 228.6 1.4e-59 CCDS8533.1 GALNT8 gene_id:26290|Hs108|chr12 ( 637) 861 208.8 1.3e-53 CCDS81755.1 GALNT9 gene_id:50614|Hs108|chr12 ( 603) 859 208.4 1.6e-53 CCDS5540.1 WBSCR17 gene_id:64409|Hs108|chr7 ( 598) 855 207.4 3.1e-53 CCDS7807.1 GALNT18 gene_id:374378|Hs108|chr11 ( 607) 819 199.1 1e-50 CCDS41866.1 GALNT9 gene_id:50614|Hs108|chr12 ( 237) 257 68.5 8.3e-12 >>CCDS5929.1 GALNTL5 gene_id:168391|Hs108|chr7 (443 aa) initn: 3012 init1: 3012 opt: 3012 Z-score: 3776.6 bits: 707.9 E(32554): 4.9e-204 Smith-Waterman score: 3012; 99.8% identity (99.8% similar) in 443 aa overlap (1-443:1-443) 10 20 30 40 50 60 pF1KE6 MRNAIIQGLFYGSLTFGIWTALLFIYLHHNHVSSWQKKSQEPLSAWSPGKKVHQQIIYGS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS59 MRNAIIQGLFYGSLTFGIWTALLFIYLHHNHVSSWQKKSQEPLSAWSPGKKVHQQIIYGS 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE6 EQIPKPHVIVKRTDEDKAKSMLGTDFNHTNPELHKELLKYGFNVIISRSLGIEREVPDTR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS59 EQIPKPHVIVKRTDEDKAKSMLGTDFNHTNPELHKELLKYGFNVIISRSLGIEREVPDTR 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE6 SKMRLQKHYPARLPTASIVICFYNEECNALFQTMSSVTNLTPHYFLEEIILVDDMSKVDD ::: :::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS59 SKMCLQKHYPARLPTASIVICFYNEECNALFQTMSSVTNLTPHYFLEEIILVDDMSKVDD 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE6 LKEKLDYHLETFRGKVKIIRNKKREGLIRARLIGASHASGDVLVFLDSHCEVNRVWLEPL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS59 LKEKLDYHLETFRGKVKIIRNKKREGLIRARLIGASHASGDVLVFLDSHCEVNRVWLEPL 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE6 LHAIAKDPKMVVCPLIDVIDDRTLEYKPSPLVRGTFDWNLQFKWDNVFSYEMDGPEGSTK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS59 LHAIAKDPKMVVCPLIDVIDDRTLEYKPSPLVRGTFDWNLQFKWDNVFSYEMDGPEGSTK 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE6 PIRSPAMSGGIFAIRRHYFNEIGQYDKDMDFWGRENLELSLRIWMCGGQLFIIPCSRVGH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS59 PIRSPAMSGGIFAIRRHYFNEIGQYDKDMDFWGRENLELSLRIWMCGGQLFIIPCSRVGH 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE6 ISKKQTGKPSTIISAMTHNYLRLVHVWLDEYKEQFFLRKPGLKYVTYGNIRERVELRKRL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS59 ISKKQTGKPSTIISAMTHNYLRLVHVWLDEYKEQFFLRKPGLKYVTYGNIRERVELRKRL 370 380 390 400 410 420 430 440 pF1KE6 GCKSFQWYLDNVFPELEASVNSL ::::::::::::::::::::::: CCDS59 GCKSFQWYLDNVFPELEASVNSL 430 440 >>CCDS5930.1 GALNT11 gene_id:63917|Hs108|chr7 (608 aa) initn: 1520 init1: 830 opt: 1472 Z-score: 1842.9 bits: 350.6 E(32554): 2.5e-96 Smith-Waterman score: 1532; 52.4% identity (75.1% similar) in 462 aa overlap (1-439:1-458) 10 20 30 40 50 pF1KE6 MRNAIIQGLFYGSL-TFGIWTALLFIYLHHNHVSSWQKKSQEPLSAWSPG----KKVHQQ : .. .. . :: : : . ::.:::.:.. ..:. : .. :... .: :: . . CCDS59 MGSVTVRYFCYGCLFTSATWTVLLFVYFNFSEVT--QPLKNVPVKGSGPHGPSPKKFYPR 10 20 30 40 50 60 70 80 90 100 pF1KE6 IIYGSEQIPKPHVIVKRTD-------ED------KAKSMLGTDFNHTNPELHKEL--LKY . : .. .:. ... : :: : .: :: ::. . :: ..: :. CCDS59 FTRGPSRVLEPQFKANKIDDVIDSRVEDPEEGHLKFSSELGMIFNERDQEL-RDLGYQKH 60 70 80 90 100 110 110 120 130 140 150 160 pF1KE6 GFNVIISRSLGIEREVPDTRSKMRLQKHYPARLPTASIVICFYNEECNALFQTMSSVTNL .::..:: :: .:.:::::. .: :: ::.::.::::::: .::..:. :: . CCDS59 AFNMLISDRLGYHRDVPDTRNAACKEKFYPPDLPAASVVICFYNEAFSALLRTVHSVIDR 120 130 140 150 160 170 170 180 190 200 210 pF1KE6 TPHYFLEEIILVDDMSKVDDLKEKLDYHLETFR-GKVKIIRNKKREGLIRARLIGASHAS :: ..:.::::::: : :::: .:: ... . ::.:.::: :::::::.:.:::.::. CCDS59 TPAHLLHEIILVDDDSDFDDLKGELDEYVQKYLPGKIKVIRNTKREGLIRGRMIGAAHAT 180 190 200 210 220 230 220 230 240 250 260 270 pF1KE6 GDVLVFLDSHCEVNRVWLEPLLHAIAKDPKMVVCPLIDVIDDRTLEYKPSPLVRGTFDWN :.:::::::::::: .::.::: :: .: . ::::.::.:. :: :. ::.::: :.:. CCDS59 GEVLVFLDSHCEVNVMWLQPLLAAIREDRHTVVCPVIDIISADTLAYSSSPVVRGGFNWG 240 250 260 270 280 290 280 290 300 310 320 330 pF1KE6 LQFKWDNVFSYEMDGPEGSTKPIRSPAMSGGIFAIRRHYFNEIGQYDKDMDFWGRENLEL :.:::: : :. ::.: ::.::.:.::.::. :.::.:.::::. ::.:: ::::. CCDS59 LHFKWDLVPLSELGRAEGATAPIKSPTMAGGLFAMNRQYFHELGQYDSGMDIWGGENLEI 300 310 320 330 340 350 340 350 360 370 380 390 pF1KE6 SLRIWMCGGQLFIIPCSRVGHISKKQT--GKPSTIISAMTHNYLRLVHVWLDEYKEQFFL :.:::::::.:::::::::::: .:. :.: ..:::: :::.::::::::::.: CCDS59 SFRIWMCGGKLFIIPCSRVGHIFRKRRPYGSPEGQ-DTMTHNSLRLAHVWLDEYKEQYFS 360 370 380 390 400 410 400 410 420 430 440 pF1KE6 RKPGLKYVTYGNIRERVELRKRLGCKSFQWYLDNVFPELEASVNSL .: :: .:::: :::::::.::::::.::::::.::.. : CCDS59 LRPDLKTKSYGNISERVELRKKLGCKSFKWYLDNVYPEMQISGSHAKPQQPIFVNRGPKR 420 430 440 450 460 470 CCDS59 PKVLQRGRLYHLQTNKCLVAQGRPSQKGGLVVLKACDYSDPNQIWIYNEEHELVLNSLLC 480 490 500 510 520 530 >>CCDS2199.1 GALNT13 gene_id:114805|Hs108|chr2 (556 aa) initn: 961 init1: 510 opt: 1106 Z-score: 1384.5 bits: 265.7 E(32554): 8.5e-71 Smith-Waterman score: 1106; 45.0% identity (73.8% similar) in 378 aa overlap (63-435:43-420) 40 50 60 70 80 90 pF1KE6 SSWQKKSQEPLSAWSPGKKVHQQIIYGSEQIPKPHVIVKRTDEDKAKSMLGTDFNHTNPE .: .....:..: .. .. . . . : CCDS21 TSLMWVLVDVFLLLYFSECNKCDDKKERSLLPALRAVISRNQEGPGEMGKAVLIPKDDQE 20 30 40 50 60 70 100 110 120 130 140 150 pF1KE6 LHKELLKYG-FNVIISRSLGIEREVPDTRSKMRLQKHYPARLPTASIVICFYNEECNALF :::.: . ::.. : ....: .::.: . : :: .::..:.:: :.:: ..:. CCDS21 KMKELFKINQFNLMASDLIALNRSLPDVRLEGCKTKVYPDELPNTSVVIVFHNEAWSTLL 80 90 100 110 120 130 160 170 180 190 200 210 pF1KE6 QTMSSVTNLTPHYFLEEIILVDDMSKVDDLKEKLDYHLETFRGKVKIIRNKKREGLIRAR .:. :: : .:::.: :.::::: :. : :: :. ...... ::::: ..: :::::: CCDS21 RTVYSVINRSPHYLLSEVILVDDASERDFLKLTLENYVKNLEVPVKIIRMEERSGLIRAR 140 150 160 170 180 190 220 230 240 250 260 270 pF1KE6 LIGASHASGDVLVFLDSHCEVNRVWLEPLLHAIAKDPKMVVCPLIDVIDDRTLEYKP-SP : ::. ..:.:..:::.::: . :::::: : .: : ::::.::::.: :.:: : CCDS21 LRGAAASKGQVITFLDAHCECTLGWLEPLLARIKEDRKTVVCPIIDVISDDTFEYMAGSD 200 210 220 230 240 250 280 290 300 310 320 pF1KE6 LVRGTFDWNLQFKWDNVFSYEMDGPEGS-TKPIRSPAMSGGIFAIRRHYFNEIGQYDKDM .. : :.:.:.:.: : . ::: .:. : :.:.:.:.::.:.: :.::.::: :: : CCDS21 MTYGGFNWKLNFRWYPVPQREMDRRKGDRTLPVRTPTMAGGLFSIDRNYFEEIGTYDAGM 260 270 280 290 300 310 330 340 350 360 370 380 pF1KE6 DFWGRENLELSLRIWMCGGQLFIIPCSRVGHISKKQTGK--PSTIISAMTHNYLRLVHVW :.:: ::::.:.:::.:::.: :. ::.:::. .: : :. ....: ::..:: CCDS21 DIWGGENLEMSFRIWQCGGSLEIVTCSHVGHVFRKATPYTFPGGTGHVINKNNRRLAEVW 320 330 340 350 360 370 390 400 410 420 430 440 pF1KE6 LDEYKEQFFLRKPGLKYVTYGNIRERVELRKRLGCKSFQWYLDNVFPELEASVNSL .::.:. :.. .::. : ::.. : ::. : :: :.:::.:..:. CCDS21 MDEFKDFFYIISPGVVKVDYGDVSVRKTLRENLKCKPFSWYLENIYPDSQIPRRYYSLGE 380 390 400 410 420 430 CCDS21 IRNVETNQCLDNMGRKENEKVGIFNCHGMGGNQVFSYTADKEIRTDDLCLDVSRLNGPVI 440 450 460 470 480 490 >>CCDS77472.1 GALNT13 gene_id:114805|Hs108|chr2 (561 aa) initn: 961 init1: 510 opt: 1106 Z-score: 1384.4 bits: 265.7 E(32554): 8.6e-71 Smith-Waterman score: 1106; 45.0% identity (73.8% similar) in 378 aa overlap (63-435:43-420) 40 50 60 70 80 90 pF1KE6 SSWQKKSQEPLSAWSPGKKVHQQIIYGSEQIPKPHVIVKRTDEDKAKSMLGTDFNHTNPE .: .....:..: .. .. . . . : CCDS77 TSLMWVLVDVFLLLYFSECNKCDDKKERSLLPALRAVISRNQEGPGEMGKAVLIPKDDQE 20 30 40 50 60 70 100 110 120 130 140 150 pF1KE6 LHKELLKYG-FNVIISRSLGIEREVPDTRSKMRLQKHYPARLPTASIVICFYNEECNALF :::.: . ::.. : ....: .::.: . : :: .::..:.:: :.:: ..:. CCDS77 KMKELFKINQFNLMASDLIALNRSLPDVRLEGCKTKVYPDELPNTSVVIVFHNEAWSTLL 80 90 100 110 120 130 160 170 180 190 200 210 pF1KE6 QTMSSVTNLTPHYFLEEIILVDDMSKVDDLKEKLDYHLETFRGKVKIIRNKKREGLIRAR .:. :: : .:::.: :.::::: :. : :: :. ...... ::::: ..: :::::: CCDS77 RTVYSVINRSPHYLLSEVILVDDASERDFLKLTLENYVKNLEVPVKIIRMEERSGLIRAR 140 150 160 170 180 190 220 230 240 250 260 270 pF1KE6 LIGASHASGDVLVFLDSHCEVNRVWLEPLLHAIAKDPKMVVCPLIDVIDDRTLEYKP-SP : ::. ..:.:..:::.::: . :::::: : .: : ::::.::::.: :.:: : CCDS77 LRGAAASKGQVITFLDAHCECTLGWLEPLLARIKEDRKTVVCPIIDVISDDTFEYMAGSD 200 210 220 230 240 250 280 290 300 310 320 pF1KE6 LVRGTFDWNLQFKWDNVFSYEMDGPEGS-TKPIRSPAMSGGIFAIRRHYFNEIGQYDKDM .. : :.:.:.:.: : . ::: .:. : :.:.:.:.::.:.: :.::.::: :: : CCDS77 MTYGGFNWKLNFRWYPVPQREMDRRKGDRTLPVRTPTMAGGLFSIDRNYFEEIGTYDAGM 260 270 280 290 300 310 330 340 350 360 370 380 pF1KE6 DFWGRENLELSLRIWMCGGQLFIIPCSRVGHISKKQTGK--PSTIISAMTHNYLRLVHVW :.:: ::::.:.:::.:::.: :. ::.:::. .: : :. ....: ::..:: CCDS77 DIWGGENLEMSFRIWQCGGSLEIVTCSHVGHVFRKATPYTFPGGTGHVINKNNRRLAEVW 320 330 340 350 360 370 390 400 410 420 430 440 pF1KE6 LDEYKEQFFLRKPGLKYVTYGNIRERVELRKRLGCKSFQWYLDNVFPELEASVNSL .::.:. :.. .::. : ::.. : ::. : :: :.:::.:..:. CCDS77 MDEFKDFFYIISPGVVKVDYGDVSVRKTLRENLKCKPFSWYLENIYPDSQIPRRYYSLGE 380 390 400 410 420 430 CCDS77 IRNVETNQCLDNMGRKENEKVGIFNCHGMGGNQVFSYTADKEIRTDDLCLDVSRLNGPVI 440 450 460 470 480 490 >>CCDS11915.1 GALNT1 gene_id:2589|Hs108|chr18 (559 aa) initn: 958 init1: 499 opt: 1089 Z-score: 1363.1 bits: 261.7 E(32554): 1.3e-69 Smith-Waterman score: 1115; 42.3% identity (70.7% similar) in 426 aa overlap (18-435:16-421) 10 20 30 40 50 pF1KE6 MRNAIIQGLFYGSLTFGIWTAL-LFIYLHHNHVSSWQKKSQEPLSAWS---PGKKVHQQI ::. : .:. :. .. .. ..:... : : . : .: :. CCDS11 MRKFAYCKVVLATSLIWVLLDMFLLLYFSECNKCDEKKERGLPAGDVLEPVQKPHE-- 10 20 30 40 50 60 70 80 90 100 110 pF1KE6 IYGSEQIPKPHVIVKRTDEDKAKSMLGTDFNHTNPELHKELLKYGFNVIISRSLGIEREV : .. :: :.. . :..: : :. .:. ::.. :. ....: . CCDS11 --GPGEMGKP-VVIPKEDQEKMKEMF--KINQ-------------FNLMASEMIALNRSL 60 70 80 90 120 130 140 150 160 170 pF1KE6 PDTRSKMRLQKHYPARLPTASIVICFYNEECNALFQTMSSVTNLTPHYFLEEIILVDDMS ::.: . : :: :::.:.:: :.:: ..:..:. :: : .:....:::.:::: : CCDS11 PDVRLEGCKTKVYPDNLPTTSVVIVFHNEAWSTLLRTVHSVINRSPRHMIEEIVLVDDAS 100 110 120 130 140 150 180 190 200 210 220 230 pF1KE6 KVDDLKEKLDYHLETFRGKVKIIRNKKREGLIRARLIGASHASGDVLVFLDSHCEVNRVW . : ::. :. ... .. :..:: ..: ::::::: ::. ..:.:..:::.::: . : CCDS11 ERDFLKRPLESYVKKLKVPVHVIRMEQRSGLIRARLKGAAVSKGQVITFLDAHCECTVGW 160 170 180 190 200 210 240 250 260 270 280 290 pF1KE6 LEPLLHAIAKDPKMVVCPLIDVIDDRTLEYKP-SPLVRGTFDWNLQFKWDNVFSYEMDGP ::::: : .: . ::::.::::.: :.:: : .. : :.:.:.:.: : . ::: CCDS11 LEPLLARIKHDRRTVVCPIIDVISDDTFEYMAGSDMTYGGFNWKLNFRWYPVPQREMDRR 220 230 240 250 260 270 300 310 320 330 340 350 pF1KE6 EGS-TKPIRSPAMSGGIFAIRRHYFNEIGQYDKDMDFWGRENLELSLRIWMCGGQLFIIP .:. : :.:.:.:.::.:.: : ::.::: :: ::.:: ::::.:.:::.::: : :. CCDS11 KGDRTLPVRTPTMAGGLFSIDRDYFQEIGTYDAGMDIWGGENLEISFRIWQCGGTLEIVT 280 290 300 310 320 330 360 370 380 390 400 410 pF1KE6 CSRVGHISKKQTGK--PSTIISAMTHNYLRLVHVWLDEYKEQFFLRKPGLKYVTYGNIRE ::.:::. .: : :. . ...: ::..::.::.:. :.. .::. : ::.: CCDS11 CSHVGHVFRKATPYTFPGGTGQIINKNNRRLAEVWMDEFKNFFYIISPGVTKVDYGDISS 340 350 360 370 380 390 420 430 440 pF1KE6 RVELRKRLGCKSFQWYLDNVFPELEASVNSL :: ::..: :: :.:::.:..:. CCDS11 RVGLRHKLQCKPFSWYLENIYPDSQIPRHYFSLGEIRNVETNQCLDNMARKENEKVGIFN 400 410 420 430 440 450 >>CCDS55860.1 GALNT4 gene_id:100528030|Hs108|chr12 (575 aa) initn: 1004 init1: 358 opt: 1068 Z-score: 1336.6 bits: 256.9 E(32554): 4e-68 Smith-Waterman score: 1068; 43.0% identity (70.8% similar) in 400 aa overlap (49-436:42-432) 20 30 40 50 60 70 pF1KE6 WTALLFIYLHHNHVSSWQKKSQEPLSAWSPGKKVHQQIIYGSEQIPKPHVIVKRTDED-K :.. ... ..:.. .: . :. : . CCDS55 RYFKGHKAAITSLDLSPNGKQLGAGRARELGSRRLSDLQKNTEDLSRP--LYKKPPADSR 20 30 40 50 60 80 90 100 110 120 130 pF1KE6 AKSMLGT----DFNHTNPELHKELL-KYGFNVIISRSLGIEREVPDTRS-KMRLQKHYPA : . : ..:. . . ..::. .:..:. .: ....:.. : : . . :: CCDS55 ALGEWGKASKLQLNEDELKQQEELIERYAINIYLSDRISLHRHIEDKRMYECKSQKFNYR 70 80 90 100 110 120 140 150 160 170 180 190 pF1KE6 RLPTASIVICFYNEECNALFQTMSSVTNLTPHYFLEEIILVDDMSKVDDLKEKLDYHLET :::.:..: :::: ..:..:. :: . .: .:.:::::::.: :: .:. .. . CCDS55 TLPTTSVIIAFYNEAWSTLLRTIHSVLETSPAVLLKEIILVDDLSDRVYLKTQLETYISN 130 140 150 160 170 180 200 210 220 230 240 250 pF1KE6 FRGKVKIIRNKKREGLIRARLIGASHASGDVLVFLDSHCEVNRVWLEPLLHAIAKDPKMV . .:..::..:::::.:::::::. :.::::.::: ::: : ::::::. :..: : CCDS55 L-DRVRLIRTNKREGLVRARLIGATFATGDVLTFLDCHCECNSGWLEPLLERIGRDETAV 190 200 210 220 230 240 260 270 280 290 300 pF1KE6 VCPLIDVIDDRTLEYKPS---PLVRGTFDWNLQFKWDNVFSYEMDGPEGSTKPIRSPAMS :::.::.:: :.:. . :.. : ::: : :.: .: . : : . :::::.:. CCDS55 VCPVIDTIDWNTFEFYMQIGEPMI-GGFDWRLTFQWHSVPKQERDRRISRIDPIRSPTMA 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE6 GGIFAIRRHYFNEIGQYDKDMDFWGRENLELSLRIWMCGGQLFIIPCSRVGHISKKQT-- ::.::. ..::. .: :: :. :: ::::::.:.:.:::.: : :::.:::. :.. CCDS55 GGLFAVSKKYFQYLGTYDTGMEVWGGENLELSFRVWQCGGKLEIHPCSHVGHVFPKRAPY 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE6 GKPSTIISAMTHNYLRLVHVWLDEYKEQFFLRKPGLKYVTYGNIRERVELRKRLGCKSFQ ..:. . .: : ..::.:::::.:. :.: . .::.: :: ::.:: ::::. CCDS55 ARPNFL-----QNTARAAEVWMDEYKEHFYNRNPPARKEAYGDISERKLLRERLRCKSFD 370 380 390 400 410 420 430 440 pF1KE6 WYLDNVFPELEASVNSL ::: ::::.: CCDS55 WYLKNVFPNLHVPEDRPGWHGAIRSRGISSECLDYNSPDNNPTGANLSLFGCHGQGGNQF 430 440 450 460 470 480 >>CCDS53817.1 GALNT4 gene_id:8693|Hs108|chr12 (578 aa) initn: 1004 init1: 358 opt: 1068 Z-score: 1336.5 bits: 256.9 E(32554): 4e-68 Smith-Waterman score: 1068; 43.0% identity (70.8% similar) in 400 aa overlap (49-436:45-435) 20 30 40 50 60 70 pF1KE6 WTALLFIYLHHNHVSSWQKKSQEPLSAWSPGKKVHQQIIYGSEQIPKPHVIVKRTDED-K :.. ... ..:.. .: . :. : . CCDS53 LAFLTVAYIFVELLVSTFHASAGAGRARELGSRRLSDLQKNTEDLSRP--LYKKPPADSR 20 30 40 50 60 70 80 90 100 110 120 130 pF1KE6 AKSMLGT----DFNHTNPELHKELL-KYGFNVIISRSLGIEREVPDTRS-KMRLQKHYPA : . : ..:. . . ..::. .:..:. .: ....:.. : : . . :: CCDS53 ALGEWGKASKLQLNEDELKQQEELIERYAINIYLSDRISLHRHIEDKRMYECKSQKFNYR 80 90 100 110 120 130 140 150 160 170 180 190 pF1KE6 RLPTASIVICFYNEECNALFQTMSSVTNLTPHYFLEEIILVDDMSKVDDLKEKLDYHLET :::.:..: :::: ..:..:. :: . .: .:.:::::::.: :: .:. .. . CCDS53 TLPTTSVIIAFYNEAWSTLLRTIHSVLETSPAVLLKEIILVDDLSDRVYLKTQLETYISN 140 150 160 170 180 190 200 210 220 230 240 250 pF1KE6 FRGKVKIIRNKKREGLIRARLIGASHASGDVLVFLDSHCEVNRVWLEPLLHAIAKDPKMV . .:..::..:::::.:::::::. :.::::.::: ::: : ::::::. :..: : CCDS53 L-DRVRLIRTNKREGLVRARLIGATFATGDVLTFLDCHCECNSGWLEPLLERIGRDETAV 200 210 220 230 240 250 260 270 280 290 300 pF1KE6 VCPLIDVIDDRTLEYKPS---PLVRGTFDWNLQFKWDNVFSYEMDGPEGSTKPIRSPAMS :::.::.:: :.:. . :.. : ::: : :.: .: . : : . :::::.:. CCDS53 VCPVIDTIDWNTFEFYMQIGEPMI-GGFDWRLTFQWHSVPKQERDRRISRIDPIRSPTMA 260 270 280 290 300 310 310 320 330 340 350 360 pF1KE6 GGIFAIRRHYFNEIGQYDKDMDFWGRENLELSLRIWMCGGQLFIIPCSRVGHISKKQT-- ::.::. ..::. .: :: :. :: ::::::.:.:.:::.: : :::.:::. :.. CCDS53 GGLFAVSKKYFQYLGTYDTGMEVWGGENLELSFRVWQCGGKLEIHPCSHVGHVFPKRAPY 320 330 340 350 360 370 370 380 390 400 410 420 pF1KE6 GKPSTIISAMTHNYLRLVHVWLDEYKEQFFLRKPGLKYVTYGNIRERVELRKRLGCKSFQ ..:. . .: : ..::.:::::.:. :.: . .::.: :: ::.:: ::::. CCDS53 ARPNFL-----QNTARAAEVWMDEYKEHFYNRNPPARKEAYGDISERKLLRERLRCKSFD 380 390 400 410 420 430 440 pF1KE6 WYLDNVFPELEASVNSL ::: ::::.: CCDS53 WYLKNVFPNLHVPEDRPGWHGAIRSRGISSECLDYNSPDNNPTGANLSLFGCHGQGGNQF 430 440 450 460 470 480 >>CCDS1582.1 GALNT2 gene_id:2590|Hs108|chr1 (571 aa) initn: 1032 init1: 312 opt: 1020 Z-score: 1276.4 bits: 245.7 E(32554): 8.9e-65 Smith-Waterman score: 1020; 46.0% identity (74.0% similar) in 339 aa overlap (102-436:104-437) 80 90 100 110 120 130 pF1KE6 RTDEDKAKSMLGTDFNHTNPELHKELLKYGFNVIISRSLGIEREVPDTRSKMRLQKHYPA :: . : .: ..: .:::: . .:.. . CCDS15 GKVRWPDFNQEAYVGGTMVRSGQDPYARNKFNQVESDKLRMDRAIPDTRHDQCQRKQWRV 80 90 100 110 120 130 140 150 160 170 180 190 pF1KE6 RLPTASIVICFYNEECNALFQTMSSVTNLTPHYFLEEIILVDDMSKVDDLKEKLDYHLET ::..:.:: :.:: .::..:. :: . .: ....:::::::.:. : : ..: CCDS15 DLPATSVVITFHNEARSALLRTVVSVLKKSPPHLIKEIILVDDYSN-DPEDGALLGKIE- 140 150 160 170 180 190 200 210 220 230 240 250 pF1KE6 FRGKVKIIRNKKREGLIRARLIGASHASGDVLVFLDSHCEVNRVWLEPLLHAIAKDPKMV ::...:: .::::.:.:. ::. :.. ::.::::::: :. ::::::. .:.: : CCDS15 ---KVRVLRNDRREGLMRSRVRGADAAQAKVLTFLDSHCECNEHWLEPLLERVAEDRTRV 200 210 220 230 240 260 270 280 290 300 pF1KE6 VCPLIDVIDDRTLEY-KPSPLVRGTFDWNLQFKWDNVFSYEMDGPEGS-TKPIRSPAMSG : :.::::. ...: : ..: ::::: :::: . . . .:. . ::..: ..: CCDS15 VSPIIDVINMDNFQYVGASADLKGGFDWNLVFKWDYMTPEQRRSRQGNPVAPIKTPMIAG 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE6 GIFAIRRHYFNEIGQYDKDMDFWGRENLELSLRIWMCGGQLFIIPCSRVGHISKKQTGK- :.:.. . ::.:.:.:: :: :: ::::.:.:.:.:::.: :::::::::. .:: CCDS15 GLFVMDKFYFEELGKYDMMMDVWGGENLEISFRVWQCGGSLEIIPCSRVGHVFRKQHPYT 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE6 -PSTIISAMTHNYLRLVHVWLDEYKEQFFLRKPGLKYVTYGNIRERVELRKRLGCKSFQW :. .....: : ..::.::::. .. :. . : ::::. :.::::.:.:: :.: CCDS15 FPGGSGTVFARNTRRAAEVWMDEYKNFYYAAVPSARNVPYGNIQSRLELRKKLSCKPFKW 370 380 390 400 410 420 430 440 pF1KE6 YLDNVFPELEASVNSL ::.::.::: CCDS15 YLENVYPELRVPDHQDIAFGALQQGTNCLDTLGHFADGVVGVYECHNAGGNQEWALTKEK 430 440 450 460 470 480 >>CCDS34104.1 GALNTL6 gene_id:442117|Hs108|chr4 (601 aa) initn: 1001 init1: 724 opt: 1018 Z-score: 1273.6 bits: 245.3 E(32554): 1.3e-64 Smith-Waterman score: 1027; 38.3% identity (67.4% similar) in 439 aa overlap (9-432:14-437) 10 20 30 40 pF1KE6 MRNAIIQGLFYGSLTF----GIWTALLFIYLHHNHVSSWQKKSQE--PLS----- :: .: : :.:. .: .. :.: . :. ::. CCDS34 MKRKQKRFLQMTLLFTVALIFLPNVGLWS----LYKDKHLVKSAEPGEQQTFPLGLGDGQ 10 20 30 40 50 50 60 70 80 90 100 pF1KE6 --AWSPGKKVHQQIIYGSEQIPKPHVIVKRTDEDKAKSMLGTDFNHTNPELHKELLKYGF .:. : .... . :.: : . . .. : . :. .: . ... :: CCDS34 FYSWTDG--LRRKDWHDYESIQKEAMRSGKGEHGKPYPL--TEEDHDDSAYREN----GF 60 70 80 90 100 110 120 130 140 150 160 pF1KE6 NVIISRSLGIEREVPDTRSKMRLQKHYPARLPTASIVICFYNEECNALFQTMSSVTNLTP :...: ....:: .:: : .: : :::..::.: :.:: ..:..:. :. : :: CCDS34 NIFVSNNIALERSLPDIRHANCKHKMYLERLPNTSIIIPFHNEGWTSLLRTIHSIINRTP 110 120 130 140 150 160 170 180 190 200 210 220 pF1KE6 HYFLEEIILVDDMSKVDDLKEKLDYHLETFRGKVKIIRNKKREGLIRARLIGASHASGDV .. :::::::.:. . ::.::. .. : .::.:.:.::::::::.::.::: : :.: CCDS34 GSLIAEIILVDDFSEREHLKDKLEEYMARF-SKVRIVRTKKREGLIRTRLLGASMARGEV 170 180 190 200 210 220 230 240 250 260 270 280 pF1KE6 LVFLDSHCEVNRVWLEPLLHAIAKDPKMVVCPLIDVIDDRTLEY--KPSPLVRGTFDWNL :.::::::::: :: :::. :: . : .:::.::::: . : . . .::.:::.. CCDS34 LTFLDSHCEVNVNWLPPLLNQIALNHKTIVCPMIDVIDHNHFGYEAQAGDAMRGAFDWEM 230 240 250 260 270 280 290 300 310 320 330 340 pF1KE6 QFKWDNVFSYEMDGPEGSTKPIRSPAMSGGIFAIRRHYFNEIGQYDKDMDFWGRENLELS .: . :.. . : :..::.:.::.::. :..: :.: :: ...:: :. :.: CCDS34 YYKRIPI-PPELQRADPSD-PFESPVMAGGLFAVDRKWFWELGGYDPGLEIWGGEQYEIS 290 300 310 320 330 340 350 360 370 380 390 400 pF1KE6 LRIWMCGGQLFIIPCSRVGHISKKQTGKPSTIISAMTHNYLRLVHVWLDEYKEQFFLRKP ...:::::..: .:::::::: .: . .....: :....:.::. : .. :.: CCDS34 FKVWMCGGEMFDVPCSRVGHIYRKYVPYKVPSGTSLARNLKRVAETWMDEFAEYIYQRRP 350 360 370 380 390 400 410 420 430 440 pF1KE6 GLKYVTYGNIRERVELRKRLGCKSFQWYLDNVFPELEASVNSL .... :.: . ::::.: ::.:.:.. : CCDS34 EYRHLSTGDISAQKELRKQLKCKDFKWFMAAVAWDVPKYYPPVEPPPAAWGEIRNVAANL 410 420 430 440 450 460 CCDS34 CVDSKHGATGTELRLDICVKDGSERTWSHEQLFTFGWREDIRPGEPLHTRKFCFDAISHN 470 480 490 500 510 520 >>CCDS82742.1 GALNT15 gene_id:117248|Hs108|chr3 (617 aa) initn: 910 init1: 510 opt: 1014 Z-score: 1268.4 bits: 244.3 E(32554): 2.5e-64 Smith-Waterman score: 1014; 41.3% identity (71.2% similar) in 378 aa overlap (71-439:124-499) 50 60 70 80 90 100 pF1KE6 EPLSAWSPGKKVHQQIIYGSEQIPKPHVIVKRTDEDKAKSMLGTDFNHTNPELHKELLKY .: :.. : :.: . : ..:: . CCDS82 QLLVAVALPQARRNQSQGRRGGSYRLIKQPRRQDKEAPKRDWGADEDGEVSE-EEELTPF 100 110 120 130 140 150 110 120 130 140 150 pF1KE6 -----GFNVIISRSLGIEREVPDTRSKMRLQKHYPARLPTASIVICFYNEECNALFQTMS :.. .: . ..: .:..: . ::.: :::::...::..: ..:..:. CCDS82 SLDPRGLQEALSARIPLQRALPEVRHPLCLQQHPQDSLPTASVILCFHDEAWSTLLRTVH 160 170 180 190 200 210 160 170 180 190 200 210 pF1KE6 SVTNLTPHYFLEEIILVDDMSKVDDLKEKLDYHLETFRGKVKIIRNKKREGLIRARLIGA :. . .:. ::.:::::::.:. .:: :. .. ..: ::..:..:: : ::::..:: CCDS82 SILDTVPRAFLKEIILVDDLSQQGQLKSALSEYVARLEG-VKLLRSNKRLGAIRARMLGA 220 230 240 250 260 270 220 230 240 250 260 270 pF1KE6 SHASGDVLVFLDSHCEVNRVWLEPLLHAIAKDPKMVVCPLIDVIDDRTLEYKPSP-LVRG ..:.::::::.:.::: . :::::: :: : . :: :.::::: .:..: :: : :: CCDS82 TRATGDVLVFMDAHCECHPGWLEPLLSRIAGDRSRVVSPVIDVIDWKTFQYYPSKDLQRG 280 290 300 310 320 330 280 290 300 310 320 330 pF1KE6 TFDWNLQFKWDNVFSYEMDGPEGSTKPIRSPAMSGGIFAIRRHYFNEIGQYDKDMDFWGR ..::.:.:.:. . . . .. .:::::.. : . :. ::::.. : ::. :.. : CCDS82 VLDWKLDFHWEPLPEHVRKALQSPISPIRSPVVPGEVVAMDRHYFQNTGAYDSLMSLRGG 340 350 360 370 380 390 340 350 360 370 380 390 pF1KE6 ENLELSLRIWMCGGQLFIIPCSRVGHISKKQTGKPSTIISAMTHNYLRLVHVWLDEYKEQ ::::::.. :.:::.. :.:::::::: ..: .. : .: .:....:: .:: CCDS82 ENLELSFKAWLCGGSVEILPCSRVGHIYQNQDSHSPLDQEATLRNRVRIAETWLGSFKET 400 410 420 430 440 450 400 410 420 430 440 pF1KE6 FFLRKP---GLKYVTYGNIRERVELRKRLGCKSFQWYLDNVFPELEASVNSL :. ..: .:. . . ::..:..::::..:.:.: ::.::: : CCDS82 FYKHSPEAFSLSKAEKPDCMERLQLQRRLGCRTFHWFLANVYPELYPSEPRPSFSGKLHN 460 470 480 490 500 510 CCDS82 TGLGLCADCQAEGDILGCPMVLAPCSDSRQQQYLQHTSRKEIHFGSPQHLCFAVRQEQVI 520 530 540 550 560 570 443 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Tue Nov 8 13:09:58 2016 done: Tue Nov 8 13:09:59 2016 Total Scan time: 2.770 Total Display time: 0.070 Function used was FASTA [36.3.4 Apr, 2011]