FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE6425, 443 aa
1>>>pF1KE6425 443 - 443 aa - 443 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 5.4260+/-0.000982; mu= 16.5370+/- 0.059
mean_var=63.5706+/-12.614, 0's: 0 Z-trim(104.4): 31 B-trim: 51 in 1/49
Lambda= 0.160859
statistics sampled from 7841 (7871) to 7841 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.614), E-opt: 0.2 (0.242), width: 16
Scan time: 2.770
The best scores are: opt bits E(32554)
CCDS5929.1 GALNTL5 gene_id:168391|Hs108|chr7 ( 443) 3012 707.9 4.9e-204
CCDS5930.1 GALNT11 gene_id:63917|Hs108|chr7 ( 608) 1472 350.6 2.5e-96
CCDS2199.1 GALNT13 gene_id:114805|Hs108|chr2 ( 556) 1106 265.7 8.5e-71
CCDS77472.1 GALNT13 gene_id:114805|Hs108|chr2 ( 561) 1106 265.7 8.6e-71
CCDS11915.1 GALNT1 gene_id:2589|Hs108|chr18 ( 559) 1089 261.7 1.3e-69
CCDS55860.1 GALNT4 gene_id:100528030|Hs108|chr12 ( 575) 1068 256.9 4e-68
CCDS53817.1 GALNT4 gene_id:8693|Hs108|chr12 ( 578) 1068 256.9 4e-68
CCDS1582.1 GALNT2 gene_id:2590|Hs108|chr1 ( 571) 1020 245.7 8.9e-65
CCDS34104.1 GALNTL6 gene_id:442117|Hs108|chr4 ( 601) 1018 245.3 1.3e-64
CCDS82742.1 GALNT15 gene_id:117248|Hs108|chr3 ( 617) 1014 244.3 2.5e-64
CCDS33711.1 GALNT15 gene_id:117248|Hs108|chr3 ( 639) 1014 244.3 2.6e-64
CCDS58705.1 GALNT14 gene_id:79623|Hs108|chr2 ( 532) 1008 242.9 5.8e-64
CCDS1773.2 GALNT14 gene_id:79623|Hs108|chr2 ( 552) 1008 242.9 6e-64
CCDS2203.1 GALNT5 gene_id:11227|Hs108|chr2 ( 940) 1006 242.6 1.3e-63
CCDS6737.1 GALNT12 gene_id:79695|Hs108|chr9 ( 581) 995 239.9 5e-63
CCDS32107.1 GALNT16 gene_id:57452|Hs108|chr14 ( 558) 988 238.3 1.5e-62
CCDS3815.1 GALNT7 gene_id:51809|Hs108|chr4 ( 657) 985 237.6 2.8e-62
CCDS58706.1 GALNT14 gene_id:79623|Hs108|chr2 ( 557) 973 234.8 1.7e-61
CCDS4325.1 GALNT10 gene_id:55568|Hs108|chr5 ( 603) 973 234.8 1.8e-61
CCDS2226.1 GALNT3 gene_id:2591|Hs108|chr2 ( 633) 968 233.7 4.2e-61
CCDS8813.1 GALNT6 gene_id:11226|Hs108|chr12 ( 622) 946 228.6 1.4e-59
CCDS8533.1 GALNT8 gene_id:26290|Hs108|chr12 ( 637) 861 208.8 1.3e-53
CCDS81755.1 GALNT9 gene_id:50614|Hs108|chr12 ( 603) 859 208.4 1.6e-53
CCDS5540.1 WBSCR17 gene_id:64409|Hs108|chr7 ( 598) 855 207.4 3.1e-53
CCDS7807.1 GALNT18 gene_id:374378|Hs108|chr11 ( 607) 819 199.1 1e-50
CCDS41866.1 GALNT9 gene_id:50614|Hs108|chr12 ( 237) 257 68.5 8.3e-12
>>CCDS5929.1 GALNTL5 gene_id:168391|Hs108|chr7 (443 aa)
initn: 3012 init1: 3012 opt: 3012 Z-score: 3776.6 bits: 707.9 E(32554): 4.9e-204
Smith-Waterman score: 3012; 99.8% identity (99.8% similar) in 443 aa overlap (1-443:1-443)
10 20 30 40 50 60
pF1KE6 MRNAIIQGLFYGSLTFGIWTALLFIYLHHNHVSSWQKKSQEPLSAWSPGKKVHQQIIYGS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS59 MRNAIIQGLFYGSLTFGIWTALLFIYLHHNHVSSWQKKSQEPLSAWSPGKKVHQQIIYGS
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE6 EQIPKPHVIVKRTDEDKAKSMLGTDFNHTNPELHKELLKYGFNVIISRSLGIEREVPDTR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS59 EQIPKPHVIVKRTDEDKAKSMLGTDFNHTNPELHKELLKYGFNVIISRSLGIEREVPDTR
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE6 SKMRLQKHYPARLPTASIVICFYNEECNALFQTMSSVTNLTPHYFLEEIILVDDMSKVDD
::: ::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS59 SKMCLQKHYPARLPTASIVICFYNEECNALFQTMSSVTNLTPHYFLEEIILVDDMSKVDD
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE6 LKEKLDYHLETFRGKVKIIRNKKREGLIRARLIGASHASGDVLVFLDSHCEVNRVWLEPL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS59 LKEKLDYHLETFRGKVKIIRNKKREGLIRARLIGASHASGDVLVFLDSHCEVNRVWLEPL
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE6 LHAIAKDPKMVVCPLIDVIDDRTLEYKPSPLVRGTFDWNLQFKWDNVFSYEMDGPEGSTK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS59 LHAIAKDPKMVVCPLIDVIDDRTLEYKPSPLVRGTFDWNLQFKWDNVFSYEMDGPEGSTK
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE6 PIRSPAMSGGIFAIRRHYFNEIGQYDKDMDFWGRENLELSLRIWMCGGQLFIIPCSRVGH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS59 PIRSPAMSGGIFAIRRHYFNEIGQYDKDMDFWGRENLELSLRIWMCGGQLFIIPCSRVGH
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE6 ISKKQTGKPSTIISAMTHNYLRLVHVWLDEYKEQFFLRKPGLKYVTYGNIRERVELRKRL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS59 ISKKQTGKPSTIISAMTHNYLRLVHVWLDEYKEQFFLRKPGLKYVTYGNIRERVELRKRL
370 380 390 400 410 420
430 440
pF1KE6 GCKSFQWYLDNVFPELEASVNSL
:::::::::::::::::::::::
CCDS59 GCKSFQWYLDNVFPELEASVNSL
430 440
>>CCDS5930.1 GALNT11 gene_id:63917|Hs108|chr7 (608 aa)
initn: 1520 init1: 830 opt: 1472 Z-score: 1842.9 bits: 350.6 E(32554): 2.5e-96
Smith-Waterman score: 1532; 52.4% identity (75.1% similar) in 462 aa overlap (1-439:1-458)
10 20 30 40 50
pF1KE6 MRNAIIQGLFYGSL-TFGIWTALLFIYLHHNHVSSWQKKSQEPLSAWSPG----KKVHQQ
: .. .. . :: : : . ::.:::.:.. ..:. : .. :... .: :: . .
CCDS59 MGSVTVRYFCYGCLFTSATWTVLLFVYFNFSEVT--QPLKNVPVKGSGPHGPSPKKFYPR
10 20 30 40 50
60 70 80 90 100
pF1KE6 IIYGSEQIPKPHVIVKRTD-------ED------KAKSMLGTDFNHTNPELHKEL--LKY
. : .. .:. ... : :: : .: :: ::. . :: ..: :.
CCDS59 FTRGPSRVLEPQFKANKIDDVIDSRVEDPEEGHLKFSSELGMIFNERDQEL-RDLGYQKH
60 70 80 90 100 110
110 120 130 140 150 160
pF1KE6 GFNVIISRSLGIEREVPDTRSKMRLQKHYPARLPTASIVICFYNEECNALFQTMSSVTNL
.::..:: :: .:.:::::. .: :: ::.::.::::::: .::..:. :: .
CCDS59 AFNMLISDRLGYHRDVPDTRNAACKEKFYPPDLPAASVVICFYNEAFSALLRTVHSVIDR
120 130 140 150 160 170
170 180 190 200 210
pF1KE6 TPHYFLEEIILVDDMSKVDDLKEKLDYHLETFR-GKVKIIRNKKREGLIRARLIGASHAS
:: ..:.::::::: : :::: .:: ... . ::.:.::: :::::::.:.:::.::.
CCDS59 TPAHLLHEIILVDDDSDFDDLKGELDEYVQKYLPGKIKVIRNTKREGLIRGRMIGAAHAT
180 190 200 210 220 230
220 230 240 250 260 270
pF1KE6 GDVLVFLDSHCEVNRVWLEPLLHAIAKDPKMVVCPLIDVIDDRTLEYKPSPLVRGTFDWN
:.:::::::::::: .::.::: :: .: . ::::.::.:. :: :. ::.::: :.:.
CCDS59 GEVLVFLDSHCEVNVMWLQPLLAAIREDRHTVVCPVIDIISADTLAYSSSPVVRGGFNWG
240 250 260 270 280 290
280 290 300 310 320 330
pF1KE6 LQFKWDNVFSYEMDGPEGSTKPIRSPAMSGGIFAIRRHYFNEIGQYDKDMDFWGRENLEL
:.:::: : :. ::.: ::.::.:.::.::. :.::.:.::::. ::.:: ::::.
CCDS59 LHFKWDLVPLSELGRAEGATAPIKSPTMAGGLFAMNRQYFHELGQYDSGMDIWGGENLEI
300 310 320 330 340 350
340 350 360 370 380 390
pF1KE6 SLRIWMCGGQLFIIPCSRVGHISKKQT--GKPSTIISAMTHNYLRLVHVWLDEYKEQFFL
:.:::::::.:::::::::::: .:. :.: ..:::: :::.::::::::::.:
CCDS59 SFRIWMCGGKLFIIPCSRVGHIFRKRRPYGSPEGQ-DTMTHNSLRLAHVWLDEYKEQYFS
360 370 380 390 400 410
400 410 420 430 440
pF1KE6 RKPGLKYVTYGNIRERVELRKRLGCKSFQWYLDNVFPELEASVNSL
.: :: .:::: :::::::.::::::.::::::.::.. :
CCDS59 LRPDLKTKSYGNISERVELRKKLGCKSFKWYLDNVYPEMQISGSHAKPQQPIFVNRGPKR
420 430 440 450 460 470
CCDS59 PKVLQRGRLYHLQTNKCLVAQGRPSQKGGLVVLKACDYSDPNQIWIYNEEHELVLNSLLC
480 490 500 510 520 530
>>CCDS2199.1 GALNT13 gene_id:114805|Hs108|chr2 (556 aa)
initn: 961 init1: 510 opt: 1106 Z-score: 1384.5 bits: 265.7 E(32554): 8.5e-71
Smith-Waterman score: 1106; 45.0% identity (73.8% similar) in 378 aa overlap (63-435:43-420)
40 50 60 70 80 90
pF1KE6 SSWQKKSQEPLSAWSPGKKVHQQIIYGSEQIPKPHVIVKRTDEDKAKSMLGTDFNHTNPE
.: .....:..: .. .. . . . :
CCDS21 TSLMWVLVDVFLLLYFSECNKCDDKKERSLLPALRAVISRNQEGPGEMGKAVLIPKDDQE
20 30 40 50 60 70
100 110 120 130 140 150
pF1KE6 LHKELLKYG-FNVIISRSLGIEREVPDTRSKMRLQKHYPARLPTASIVICFYNEECNALF
:::.: . ::.. : ....: .::.: . : :: .::..:.:: :.:: ..:.
CCDS21 KMKELFKINQFNLMASDLIALNRSLPDVRLEGCKTKVYPDELPNTSVVIVFHNEAWSTLL
80 90 100 110 120 130
160 170 180 190 200 210
pF1KE6 QTMSSVTNLTPHYFLEEIILVDDMSKVDDLKEKLDYHLETFRGKVKIIRNKKREGLIRAR
.:. :: : .:::.: :.::::: :. : :: :. ...... ::::: ..: ::::::
CCDS21 RTVYSVINRSPHYLLSEVILVDDASERDFLKLTLENYVKNLEVPVKIIRMEERSGLIRAR
140 150 160 170 180 190
220 230 240 250 260 270
pF1KE6 LIGASHASGDVLVFLDSHCEVNRVWLEPLLHAIAKDPKMVVCPLIDVIDDRTLEYKP-SP
: ::. ..:.:..:::.::: . :::::: : .: : ::::.::::.: :.:: :
CCDS21 LRGAAASKGQVITFLDAHCECTLGWLEPLLARIKEDRKTVVCPIIDVISDDTFEYMAGSD
200 210 220 230 240 250
280 290 300 310 320
pF1KE6 LVRGTFDWNLQFKWDNVFSYEMDGPEGS-TKPIRSPAMSGGIFAIRRHYFNEIGQYDKDM
.. : :.:.:.:.: : . ::: .:. : :.:.:.:.::.:.: :.::.::: :: :
CCDS21 MTYGGFNWKLNFRWYPVPQREMDRRKGDRTLPVRTPTMAGGLFSIDRNYFEEIGTYDAGM
260 270 280 290 300 310
330 340 350 360 370 380
pF1KE6 DFWGRENLELSLRIWMCGGQLFIIPCSRVGHISKKQTGK--PSTIISAMTHNYLRLVHVW
:.:: ::::.:.:::.:::.: :. ::.:::. .: : :. ....: ::..::
CCDS21 DIWGGENLEMSFRIWQCGGSLEIVTCSHVGHVFRKATPYTFPGGTGHVINKNNRRLAEVW
320 330 340 350 360 370
390 400 410 420 430 440
pF1KE6 LDEYKEQFFLRKPGLKYVTYGNIRERVELRKRLGCKSFQWYLDNVFPELEASVNSL
.::.:. :.. .::. : ::.. : ::. : :: :.:::.:..:.
CCDS21 MDEFKDFFYIISPGVVKVDYGDVSVRKTLRENLKCKPFSWYLENIYPDSQIPRRYYSLGE
380 390 400 410 420 430
CCDS21 IRNVETNQCLDNMGRKENEKVGIFNCHGMGGNQVFSYTADKEIRTDDLCLDVSRLNGPVI
440 450 460 470 480 490
>>CCDS77472.1 GALNT13 gene_id:114805|Hs108|chr2 (561 aa)
initn: 961 init1: 510 opt: 1106 Z-score: 1384.4 bits: 265.7 E(32554): 8.6e-71
Smith-Waterman score: 1106; 45.0% identity (73.8% similar) in 378 aa overlap (63-435:43-420)
40 50 60 70 80 90
pF1KE6 SSWQKKSQEPLSAWSPGKKVHQQIIYGSEQIPKPHVIVKRTDEDKAKSMLGTDFNHTNPE
.: .....:..: .. .. . . . :
CCDS77 TSLMWVLVDVFLLLYFSECNKCDDKKERSLLPALRAVISRNQEGPGEMGKAVLIPKDDQE
20 30 40 50 60 70
100 110 120 130 140 150
pF1KE6 LHKELLKYG-FNVIISRSLGIEREVPDTRSKMRLQKHYPARLPTASIVICFYNEECNALF
:::.: . ::.. : ....: .::.: . : :: .::..:.:: :.:: ..:.
CCDS77 KMKELFKINQFNLMASDLIALNRSLPDVRLEGCKTKVYPDELPNTSVVIVFHNEAWSTLL
80 90 100 110 120 130
160 170 180 190 200 210
pF1KE6 QTMSSVTNLTPHYFLEEIILVDDMSKVDDLKEKLDYHLETFRGKVKIIRNKKREGLIRAR
.:. :: : .:::.: :.::::: :. : :: :. ...... ::::: ..: ::::::
CCDS77 RTVYSVINRSPHYLLSEVILVDDASERDFLKLTLENYVKNLEVPVKIIRMEERSGLIRAR
140 150 160 170 180 190
220 230 240 250 260 270
pF1KE6 LIGASHASGDVLVFLDSHCEVNRVWLEPLLHAIAKDPKMVVCPLIDVIDDRTLEYKP-SP
: ::. ..:.:..:::.::: . :::::: : .: : ::::.::::.: :.:: :
CCDS77 LRGAAASKGQVITFLDAHCECTLGWLEPLLARIKEDRKTVVCPIIDVISDDTFEYMAGSD
200 210 220 230 240 250
280 290 300 310 320
pF1KE6 LVRGTFDWNLQFKWDNVFSYEMDGPEGS-TKPIRSPAMSGGIFAIRRHYFNEIGQYDKDM
.. : :.:.:.:.: : . ::: .:. : :.:.:.:.::.:.: :.::.::: :: :
CCDS77 MTYGGFNWKLNFRWYPVPQREMDRRKGDRTLPVRTPTMAGGLFSIDRNYFEEIGTYDAGM
260 270 280 290 300 310
330 340 350 360 370 380
pF1KE6 DFWGRENLELSLRIWMCGGQLFIIPCSRVGHISKKQTGK--PSTIISAMTHNYLRLVHVW
:.:: ::::.:.:::.:::.: :. ::.:::. .: : :. ....: ::..::
CCDS77 DIWGGENLEMSFRIWQCGGSLEIVTCSHVGHVFRKATPYTFPGGTGHVINKNNRRLAEVW
320 330 340 350 360 370
390 400 410 420 430 440
pF1KE6 LDEYKEQFFLRKPGLKYVTYGNIRERVELRKRLGCKSFQWYLDNVFPELEASVNSL
.::.:. :.. .::. : ::.. : ::. : :: :.:::.:..:.
CCDS77 MDEFKDFFYIISPGVVKVDYGDVSVRKTLRENLKCKPFSWYLENIYPDSQIPRRYYSLGE
380 390 400 410 420 430
CCDS77 IRNVETNQCLDNMGRKENEKVGIFNCHGMGGNQVFSYTADKEIRTDDLCLDVSRLNGPVI
440 450 460 470 480 490
>>CCDS11915.1 GALNT1 gene_id:2589|Hs108|chr18 (559 aa)
initn: 958 init1: 499 opt: 1089 Z-score: 1363.1 bits: 261.7 E(32554): 1.3e-69
Smith-Waterman score: 1115; 42.3% identity (70.7% similar) in 426 aa overlap (18-435:16-421)
10 20 30 40 50
pF1KE6 MRNAIIQGLFYGSLTFGIWTAL-LFIYLHHNHVSSWQKKSQEPLSAWS---PGKKVHQQI
::. : .:. :. .. .. ..:... : : . : .: :.
CCDS11 MRKFAYCKVVLATSLIWVLLDMFLLLYFSECNKCDEKKERGLPAGDVLEPVQKPHE--
10 20 30 40 50
60 70 80 90 100 110
pF1KE6 IYGSEQIPKPHVIVKRTDEDKAKSMLGTDFNHTNPELHKELLKYGFNVIISRSLGIEREV
: .. :: :.. . :..: : :. .:. ::.. :. ....: .
CCDS11 --GPGEMGKP-VVIPKEDQEKMKEMF--KINQ-------------FNLMASEMIALNRSL
60 70 80 90
120 130 140 150 160 170
pF1KE6 PDTRSKMRLQKHYPARLPTASIVICFYNEECNALFQTMSSVTNLTPHYFLEEIILVDDMS
::.: . : :: :::.:.:: :.:: ..:..:. :: : .:....:::.:::: :
CCDS11 PDVRLEGCKTKVYPDNLPTTSVVIVFHNEAWSTLLRTVHSVINRSPRHMIEEIVLVDDAS
100 110 120 130 140 150
180 190 200 210 220 230
pF1KE6 KVDDLKEKLDYHLETFRGKVKIIRNKKREGLIRARLIGASHASGDVLVFLDSHCEVNRVW
. : ::. :. ... .. :..:: ..: ::::::: ::. ..:.:..:::.::: . :
CCDS11 ERDFLKRPLESYVKKLKVPVHVIRMEQRSGLIRARLKGAAVSKGQVITFLDAHCECTVGW
160 170 180 190 200 210
240 250 260 270 280 290
pF1KE6 LEPLLHAIAKDPKMVVCPLIDVIDDRTLEYKP-SPLVRGTFDWNLQFKWDNVFSYEMDGP
::::: : .: . ::::.::::.: :.:: : .. : :.:.:.:.: : . :::
CCDS11 LEPLLARIKHDRRTVVCPIIDVISDDTFEYMAGSDMTYGGFNWKLNFRWYPVPQREMDRR
220 230 240 250 260 270
300 310 320 330 340 350
pF1KE6 EGS-TKPIRSPAMSGGIFAIRRHYFNEIGQYDKDMDFWGRENLELSLRIWMCGGQLFIIP
.:. : :.:.:.:.::.:.: : ::.::: :: ::.:: ::::.:.:::.::: : :.
CCDS11 KGDRTLPVRTPTMAGGLFSIDRDYFQEIGTYDAGMDIWGGENLEISFRIWQCGGTLEIVT
280 290 300 310 320 330
360 370 380 390 400 410
pF1KE6 CSRVGHISKKQTGK--PSTIISAMTHNYLRLVHVWLDEYKEQFFLRKPGLKYVTYGNIRE
::.:::. .: : :. . ...: ::..::.::.:. :.. .::. : ::.:
CCDS11 CSHVGHVFRKATPYTFPGGTGQIINKNNRRLAEVWMDEFKNFFYIISPGVTKVDYGDISS
340 350 360 370 380 390
420 430 440
pF1KE6 RVELRKRLGCKSFQWYLDNVFPELEASVNSL
:: ::..: :: :.:::.:..:.
CCDS11 RVGLRHKLQCKPFSWYLENIYPDSQIPRHYFSLGEIRNVETNQCLDNMARKENEKVGIFN
400 410 420 430 440 450
>>CCDS55860.1 GALNT4 gene_id:100528030|Hs108|chr12 (575 aa)
initn: 1004 init1: 358 opt: 1068 Z-score: 1336.6 bits: 256.9 E(32554): 4e-68
Smith-Waterman score: 1068; 43.0% identity (70.8% similar) in 400 aa overlap (49-436:42-432)
20 30 40 50 60 70
pF1KE6 WTALLFIYLHHNHVSSWQKKSQEPLSAWSPGKKVHQQIIYGSEQIPKPHVIVKRTDED-K
:.. ... ..:.. .: . :. : .
CCDS55 RYFKGHKAAITSLDLSPNGKQLGAGRARELGSRRLSDLQKNTEDLSRP--LYKKPPADSR
20 30 40 50 60
80 90 100 110 120 130
pF1KE6 AKSMLGT----DFNHTNPELHKELL-KYGFNVIISRSLGIEREVPDTRS-KMRLQKHYPA
: . : ..:. . . ..::. .:..:. .: ....:.. : : . . ::
CCDS55 ALGEWGKASKLQLNEDELKQQEELIERYAINIYLSDRISLHRHIEDKRMYECKSQKFNYR
70 80 90 100 110 120
140 150 160 170 180 190
pF1KE6 RLPTASIVICFYNEECNALFQTMSSVTNLTPHYFLEEIILVDDMSKVDDLKEKLDYHLET
:::.:..: :::: ..:..:. :: . .: .:.:::::::.: :: .:. .. .
CCDS55 TLPTTSVIIAFYNEAWSTLLRTIHSVLETSPAVLLKEIILVDDLSDRVYLKTQLETYISN
130 140 150 160 170 180
200 210 220 230 240 250
pF1KE6 FRGKVKIIRNKKREGLIRARLIGASHASGDVLVFLDSHCEVNRVWLEPLLHAIAKDPKMV
. .:..::..:::::.:::::::. :.::::.::: ::: : ::::::. :..: :
CCDS55 L-DRVRLIRTNKREGLVRARLIGATFATGDVLTFLDCHCECNSGWLEPLLERIGRDETAV
190 200 210 220 230 240
260 270 280 290 300
pF1KE6 VCPLIDVIDDRTLEYKPS---PLVRGTFDWNLQFKWDNVFSYEMDGPEGSTKPIRSPAMS
:::.::.:: :.:. . :.. : ::: : :.: .: . : : . :::::.:.
CCDS55 VCPVIDTIDWNTFEFYMQIGEPMI-GGFDWRLTFQWHSVPKQERDRRISRIDPIRSPTMA
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE6 GGIFAIRRHYFNEIGQYDKDMDFWGRENLELSLRIWMCGGQLFIIPCSRVGHISKKQT--
::.::. ..::. .: :: :. :: ::::::.:.:.:::.: : :::.:::. :..
CCDS55 GGLFAVSKKYFQYLGTYDTGMEVWGGENLELSFRVWQCGGKLEIHPCSHVGHVFPKRAPY
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE6 GKPSTIISAMTHNYLRLVHVWLDEYKEQFFLRKPGLKYVTYGNIRERVELRKRLGCKSFQ
..:. . .: : ..::.:::::.:. :.: . .::.: :: ::.:: ::::.
CCDS55 ARPNFL-----QNTARAAEVWMDEYKEHFYNRNPPARKEAYGDISERKLLRERLRCKSFD
370 380 390 400 410 420
430 440
pF1KE6 WYLDNVFPELEASVNSL
::: ::::.:
CCDS55 WYLKNVFPNLHVPEDRPGWHGAIRSRGISSECLDYNSPDNNPTGANLSLFGCHGQGGNQF
430 440 450 460 470 480
>>CCDS53817.1 GALNT4 gene_id:8693|Hs108|chr12 (578 aa)
initn: 1004 init1: 358 opt: 1068 Z-score: 1336.5 bits: 256.9 E(32554): 4e-68
Smith-Waterman score: 1068; 43.0% identity (70.8% similar) in 400 aa overlap (49-436:45-435)
20 30 40 50 60 70
pF1KE6 WTALLFIYLHHNHVSSWQKKSQEPLSAWSPGKKVHQQIIYGSEQIPKPHVIVKRTDED-K
:.. ... ..:.. .: . :. : .
CCDS53 LAFLTVAYIFVELLVSTFHASAGAGRARELGSRRLSDLQKNTEDLSRP--LYKKPPADSR
20 30 40 50 60 70
80 90 100 110 120 130
pF1KE6 AKSMLGT----DFNHTNPELHKELL-KYGFNVIISRSLGIEREVPDTRS-KMRLQKHYPA
: . : ..:. . . ..::. .:..:. .: ....:.. : : . . ::
CCDS53 ALGEWGKASKLQLNEDELKQQEELIERYAINIYLSDRISLHRHIEDKRMYECKSQKFNYR
80 90 100 110 120 130
140 150 160 170 180 190
pF1KE6 RLPTASIVICFYNEECNALFQTMSSVTNLTPHYFLEEIILVDDMSKVDDLKEKLDYHLET
:::.:..: :::: ..:..:. :: . .: .:.:::::::.: :: .:. .. .
CCDS53 TLPTTSVIIAFYNEAWSTLLRTIHSVLETSPAVLLKEIILVDDLSDRVYLKTQLETYISN
140 150 160 170 180 190
200 210 220 230 240 250
pF1KE6 FRGKVKIIRNKKREGLIRARLIGASHASGDVLVFLDSHCEVNRVWLEPLLHAIAKDPKMV
. .:..::..:::::.:::::::. :.::::.::: ::: : ::::::. :..: :
CCDS53 L-DRVRLIRTNKREGLVRARLIGATFATGDVLTFLDCHCECNSGWLEPLLERIGRDETAV
200 210 220 230 240 250
260 270 280 290 300
pF1KE6 VCPLIDVIDDRTLEYKPS---PLVRGTFDWNLQFKWDNVFSYEMDGPEGSTKPIRSPAMS
:::.::.:: :.:. . :.. : ::: : :.: .: . : : . :::::.:.
CCDS53 VCPVIDTIDWNTFEFYMQIGEPMI-GGFDWRLTFQWHSVPKQERDRRISRIDPIRSPTMA
260 270 280 290 300 310
310 320 330 340 350 360
pF1KE6 GGIFAIRRHYFNEIGQYDKDMDFWGRENLELSLRIWMCGGQLFIIPCSRVGHISKKQT--
::.::. ..::. .: :: :. :: ::::::.:.:.:::.: : :::.:::. :..
CCDS53 GGLFAVSKKYFQYLGTYDTGMEVWGGENLELSFRVWQCGGKLEIHPCSHVGHVFPKRAPY
320 330 340 350 360 370
370 380 390 400 410 420
pF1KE6 GKPSTIISAMTHNYLRLVHVWLDEYKEQFFLRKPGLKYVTYGNIRERVELRKRLGCKSFQ
..:. . .: : ..::.:::::.:. :.: . .::.: :: ::.:: ::::.
CCDS53 ARPNFL-----QNTARAAEVWMDEYKEHFYNRNPPARKEAYGDISERKLLRERLRCKSFD
380 390 400 410 420
430 440
pF1KE6 WYLDNVFPELEASVNSL
::: ::::.:
CCDS53 WYLKNVFPNLHVPEDRPGWHGAIRSRGISSECLDYNSPDNNPTGANLSLFGCHGQGGNQF
430 440 450 460 470 480
>>CCDS1582.1 GALNT2 gene_id:2590|Hs108|chr1 (571 aa)
initn: 1032 init1: 312 opt: 1020 Z-score: 1276.4 bits: 245.7 E(32554): 8.9e-65
Smith-Waterman score: 1020; 46.0% identity (74.0% similar) in 339 aa overlap (102-436:104-437)
80 90 100 110 120 130
pF1KE6 RTDEDKAKSMLGTDFNHTNPELHKELLKYGFNVIISRSLGIEREVPDTRSKMRLQKHYPA
:: . : .: ..: .:::: . .:.. .
CCDS15 GKVRWPDFNQEAYVGGTMVRSGQDPYARNKFNQVESDKLRMDRAIPDTRHDQCQRKQWRV
80 90 100 110 120 130
140 150 160 170 180 190
pF1KE6 RLPTASIVICFYNEECNALFQTMSSVTNLTPHYFLEEIILVDDMSKVDDLKEKLDYHLET
::..:.:: :.:: .::..:. :: . .: ....:::::::.:. : : ..:
CCDS15 DLPATSVVITFHNEARSALLRTVVSVLKKSPPHLIKEIILVDDYSN-DPEDGALLGKIE-
140 150 160 170 180 190
200 210 220 230 240 250
pF1KE6 FRGKVKIIRNKKREGLIRARLIGASHASGDVLVFLDSHCEVNRVWLEPLLHAIAKDPKMV
::...:: .::::.:.:. ::. :.. ::.::::::: :. ::::::. .:.: :
CCDS15 ---KVRVLRNDRREGLMRSRVRGADAAQAKVLTFLDSHCECNEHWLEPLLERVAEDRTRV
200 210 220 230 240
260 270 280 290 300
pF1KE6 VCPLIDVIDDRTLEY-KPSPLVRGTFDWNLQFKWDNVFSYEMDGPEGS-TKPIRSPAMSG
: :.::::. ...: : ..: ::::: :::: . . . .:. . ::..: ..:
CCDS15 VSPIIDVINMDNFQYVGASADLKGGFDWNLVFKWDYMTPEQRRSRQGNPVAPIKTPMIAG
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE6 GIFAIRRHYFNEIGQYDKDMDFWGRENLELSLRIWMCGGQLFIIPCSRVGHISKKQTGK-
:.:.. . ::.:.:.:: :: :: ::::.:.:.:.:::.: :::::::::. .::
CCDS15 GLFVMDKFYFEELGKYDMMMDVWGGENLEISFRVWQCGGSLEIIPCSRVGHVFRKQHPYT
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE6 -PSTIISAMTHNYLRLVHVWLDEYKEQFFLRKPGLKYVTYGNIRERVELRKRLGCKSFQW
:. .....: : ..::.::::. .. :. . : ::::. :.::::.:.:: :.:
CCDS15 FPGGSGTVFARNTRRAAEVWMDEYKNFYYAAVPSARNVPYGNIQSRLELRKKLSCKPFKW
370 380 390 400 410 420
430 440
pF1KE6 YLDNVFPELEASVNSL
::.::.:::
CCDS15 YLENVYPELRVPDHQDIAFGALQQGTNCLDTLGHFADGVVGVYECHNAGGNQEWALTKEK
430 440 450 460 470 480
>>CCDS34104.1 GALNTL6 gene_id:442117|Hs108|chr4 (601 aa)
initn: 1001 init1: 724 opt: 1018 Z-score: 1273.6 bits: 245.3 E(32554): 1.3e-64
Smith-Waterman score: 1027; 38.3% identity (67.4% similar) in 439 aa overlap (9-432:14-437)
10 20 30 40
pF1KE6 MRNAIIQGLFYGSLTF----GIWTALLFIYLHHNHVSSWQKKSQE--PLS-----
:: .: : :.:. .: .. :.: . :. ::.
CCDS34 MKRKQKRFLQMTLLFTVALIFLPNVGLWS----LYKDKHLVKSAEPGEQQTFPLGLGDGQ
10 20 30 40 50
50 60 70 80 90 100
pF1KE6 --AWSPGKKVHQQIIYGSEQIPKPHVIVKRTDEDKAKSMLGTDFNHTNPELHKELLKYGF
.:. : .... . :.: : . . .. : . :. .: . ... ::
CCDS34 FYSWTDG--LRRKDWHDYESIQKEAMRSGKGEHGKPYPL--TEEDHDDSAYREN----GF
60 70 80 90 100
110 120 130 140 150 160
pF1KE6 NVIISRSLGIEREVPDTRSKMRLQKHYPARLPTASIVICFYNEECNALFQTMSSVTNLTP
:...: ....:: .:: : .: : :::..::.: :.:: ..:..:. :. : ::
CCDS34 NIFVSNNIALERSLPDIRHANCKHKMYLERLPNTSIIIPFHNEGWTSLLRTIHSIINRTP
110 120 130 140 150 160
170 180 190 200 210 220
pF1KE6 HYFLEEIILVDDMSKVDDLKEKLDYHLETFRGKVKIIRNKKREGLIRARLIGASHASGDV
.. :::::::.:. . ::.::. .. : .::.:.:.::::::::.::.::: : :.:
CCDS34 GSLIAEIILVDDFSEREHLKDKLEEYMARF-SKVRIVRTKKREGLIRTRLLGASMARGEV
170 180 190 200 210 220
230 240 250 260 270 280
pF1KE6 LVFLDSHCEVNRVWLEPLLHAIAKDPKMVVCPLIDVIDDRTLEY--KPSPLVRGTFDWNL
:.::::::::: :: :::. :: . : .:::.::::: . : . . .::.:::..
CCDS34 LTFLDSHCEVNVNWLPPLLNQIALNHKTIVCPMIDVIDHNHFGYEAQAGDAMRGAFDWEM
230 240 250 260 270 280
290 300 310 320 330 340
pF1KE6 QFKWDNVFSYEMDGPEGSTKPIRSPAMSGGIFAIRRHYFNEIGQYDKDMDFWGRENLELS
.: . :.. . : :..::.:.::.::. :..: :.: :: ...:: :. :.:
CCDS34 YYKRIPI-PPELQRADPSD-PFESPVMAGGLFAVDRKWFWELGGYDPGLEIWGGEQYEIS
290 300 310 320 330 340
350 360 370 380 390 400
pF1KE6 LRIWMCGGQLFIIPCSRVGHISKKQTGKPSTIISAMTHNYLRLVHVWLDEYKEQFFLRKP
...:::::..: .:::::::: .: . .....: :....:.::. : .. :.:
CCDS34 FKVWMCGGEMFDVPCSRVGHIYRKYVPYKVPSGTSLARNLKRVAETWMDEFAEYIYQRRP
350 360 370 380 390 400
410 420 430 440
pF1KE6 GLKYVTYGNIRERVELRKRLGCKSFQWYLDNVFPELEASVNSL
.... :.: . ::::.: ::.:.:.. :
CCDS34 EYRHLSTGDISAQKELRKQLKCKDFKWFMAAVAWDVPKYYPPVEPPPAAWGEIRNVAANL
410 420 430 440 450 460
CCDS34 CVDSKHGATGTELRLDICVKDGSERTWSHEQLFTFGWREDIRPGEPLHTRKFCFDAISHN
470 480 490 500 510 520
>>CCDS82742.1 GALNT15 gene_id:117248|Hs108|chr3 (617 aa)
initn: 910 init1: 510 opt: 1014 Z-score: 1268.4 bits: 244.3 E(32554): 2.5e-64
Smith-Waterman score: 1014; 41.3% identity (71.2% similar) in 378 aa overlap (71-439:124-499)
50 60 70 80 90 100
pF1KE6 EPLSAWSPGKKVHQQIIYGSEQIPKPHVIVKRTDEDKAKSMLGTDFNHTNPELHKELLKY
.: :.. : :.: . : ..:: .
CCDS82 QLLVAVALPQARRNQSQGRRGGSYRLIKQPRRQDKEAPKRDWGADEDGEVSE-EEELTPF
100 110 120 130 140 150
110 120 130 140 150
pF1KE6 -----GFNVIISRSLGIEREVPDTRSKMRLQKHYPARLPTASIVICFYNEECNALFQTMS
:.. .: . ..: .:..: . ::.: :::::...::..: ..:..:.
CCDS82 SLDPRGLQEALSARIPLQRALPEVRHPLCLQQHPQDSLPTASVILCFHDEAWSTLLRTVH
160 170 180 190 200 210
160 170 180 190 200 210
pF1KE6 SVTNLTPHYFLEEIILVDDMSKVDDLKEKLDYHLETFRGKVKIIRNKKREGLIRARLIGA
:. . .:. ::.:::::::.:. .:: :. .. ..: ::..:..:: : ::::..::
CCDS82 SILDTVPRAFLKEIILVDDLSQQGQLKSALSEYVARLEG-VKLLRSNKRLGAIRARMLGA
220 230 240 250 260 270
220 230 240 250 260 270
pF1KE6 SHASGDVLVFLDSHCEVNRVWLEPLLHAIAKDPKMVVCPLIDVIDDRTLEYKPSP-LVRG
..:.::::::.:.::: . :::::: :: : . :: :.::::: .:..: :: : ::
CCDS82 TRATGDVLVFMDAHCECHPGWLEPLLSRIAGDRSRVVSPVIDVIDWKTFQYYPSKDLQRG
280 290 300 310 320 330
280 290 300 310 320 330
pF1KE6 TFDWNLQFKWDNVFSYEMDGPEGSTKPIRSPAMSGGIFAIRRHYFNEIGQYDKDMDFWGR
..::.:.:.:. . . . .. .:::::.. : . :. ::::.. : ::. :.. :
CCDS82 VLDWKLDFHWEPLPEHVRKALQSPISPIRSPVVPGEVVAMDRHYFQNTGAYDSLMSLRGG
340 350 360 370 380 390
340 350 360 370 380 390
pF1KE6 ENLELSLRIWMCGGQLFIIPCSRVGHISKKQTGKPSTIISAMTHNYLRLVHVWLDEYKEQ
::::::.. :.:::.. :.:::::::: ..: .. : .: .:....:: .::
CCDS82 ENLELSFKAWLCGGSVEILPCSRVGHIYQNQDSHSPLDQEATLRNRVRIAETWLGSFKET
400 410 420 430 440 450
400 410 420 430 440
pF1KE6 FFLRKP---GLKYVTYGNIRERVELRKRLGCKSFQWYLDNVFPELEASVNSL
:. ..: .:. . . ::..:..::::..:.:.: ::.::: :
CCDS82 FYKHSPEAFSLSKAEKPDCMERLQLQRRLGCRTFHWFLANVYPELYPSEPRPSFSGKLHN
460 470 480 490 500 510
CCDS82 TGLGLCADCQAEGDILGCPMVLAPCSDSRQQQYLQHTSRKEIHFGSPQHLCFAVRQEQVI
520 530 540 550 560 570
443 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Tue Nov 8 13:09:58 2016 done: Tue Nov 8 13:09:59 2016
Total Scan time: 2.770 Total Display time: 0.070
Function used was FASTA [36.3.4 Apr, 2011]