FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE2214, 530 aa
1>>>pF1KE2214 530 - 530 aa - 530 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 6.0983+/-0.000662; mu= 17.0612+/- 0.040
mean_var=117.4231+/-23.659, 0's: 0 Z-trim(114.7): 18 B-trim: 0 in 0/51
Lambda= 0.118358
statistics sampled from 15269 (15284) to 15269 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.787), E-opt: 0.2 (0.469), width: 16
Scan time: 4.080
The best scores are: opt bits E(32554)
CCDS8301.1 FUT4 gene_id:2526|Hs108|chr11 ( 530) 3839 666.1 2.8e-191
CCDS12153.1 FUT3 gene_id:2525|Hs108|chr19 ( 361) 863 157.8 2e-38
CCDS12154.1 FUT5 gene_id:2527|Hs108|chr19 ( 374) 855 156.4 5.2e-38
CCDS12152.1 FUT6 gene_id:2528|Hs108|chr19 ( 359) 850 155.6 9.2e-38
CCDS7022.1 FUT7 gene_id:2529|Hs108|chr9 ( 342) 732 135.4 1e-31
CCDS5033.1 FUT9 gene_id:10690|Hs108|chr6 ( 359) 659 122.9 6e-28
>>CCDS8301.1 FUT4 gene_id:2526|Hs108|chr11 (530 aa)
initn: 3839 init1: 3839 opt: 3839 Z-score: 3547.6 bits: 666.1 E(32554): 2.8e-191
Smith-Waterman score: 3839; 99.8% identity (100.0% similar) in 530 aa overlap (1-530:1-530)
10 20 30 40 50 60
pF1KE2 MRRLWGAARKPSGAGWEKEWAEAPQEAPGAWSGRLGPGRSGRKGRAVPGWASWPAHLALA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS83 MRRLWGAARKPSGAGWEKEWAEAPQEAPGAWSGRLGPGRSGRKGRAVPGWASWPAHLALA
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE2 ARPARHLGGAGQGPRPLHSGTAPFHSRASGERQRRLEPQLQHESRCRSSTPADAWRAEAA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS83 ARPARHLGGAGQGPRPLHSGTAPFHSRASGERQRRLEPQLQHESRCRSSTPADAWRAEAA
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE2 LPVRAMGAPWGSPTAAAGGRRGWRRGRGLPWTVCVLAAAGLTCTALITYACWGQLPPLPW
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS83 LPVRAMGAPWGSPTAAAGGRRGWRRGRGLPWTVCVLAAAGLTCTALITYACWGQLPPLPW
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE2 ASPTPSRPVGVLLWWEPFGGRDSAPRPPPDCRLRFNISGCRLLTDRASYGEAQAVLFHHR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS83 ASPTPSRPVGVLLWWEPFGGRDSAPRPPPDCRLRFNISGCRLLTDRASYGEAQAVLFHHR
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE2 DLVKGPPDWPPPWGVQAHTAEEVDLRVLDYEEAAAAAEALATSSPRPPGQRWVWMNFESP
::::::::::::::.:::::::::::::::::::::::::::::::::::::::::::::
CCDS83 DLVKGPPDWPPPWGIQAHTAEEVDLRVLDYEEAAAAAEALATSSPRPPGQRWVWMNFESP
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE2 SHSPGLRSLASNLFNWTLSYRADSDVFVPYGYLYPRSHPGDPPSGLAPPLSRKQGLVAWV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS83 SHSPGLRSLASNLFNWTLSYRADSDVFVPYGYLYPRSHPGDPPSGLAPPLSRKQGLVAWV
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE2 VSHWDERQARVRYYHQLSQHVTVDVFGRGGPGQPVPEIGLLHTVARYKFYLAFENSQHLD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS83 VSHWDERQARVRYYHQLSQHVTVDVFGRGGPGQPVPEIGLLHTVARYKFYLAFENSQHLD
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE2 YITEKLWRNALLAGAVPVVLGPDRANYERFVPRGAFIHVDDFPSASSLASYLLFLDRNPA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS83 YITEKLWRNALLAGAVPVVLGPDRANYERFVPRGAFIHVDDFPSASSLASYLLFLDRNPA
430 440 450 460 470 480
490 500 510 520 530
pF1KE2 VYRRYFHWRRSYAVHITSFWDEPWCRVCQAVQRAGDRPKSIRNLASWFER
::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS83 VYRRYFHWRRSYAVHITSFWDEPWCRVCQAVQRAGDRPKSIRNLASWFER
490 500 510 520 530
>>CCDS12153.1 FUT3 gene_id:2525|Hs108|chr19 (361 aa)
initn: 828 init1: 401 opt: 863 Z-score: 803.4 bits: 157.8 E(32554): 2e-38
Smith-Waterman score: 896; 43.7% identity (65.1% similar) in 350 aa overlap (184-528:57-360)
160 170 180 190 200 210
pF1KE2 CVLAAAGLTCTALITYACWGQLPPLPWASPTPSRPVGVLLW--WEPFGGRDSAPRPPPDC
::.::. ..: : :: : :
CCDS12 AVCFFSYLRVSRDDATGSPRAPSGSSRQDTTPTRPTLLILLRTW-PF----HIPVALSRC
30 40 50 60 70 80
220 230 240 250 260 270
pF1KE2 -RLRFNISGCRLLTDRASYGEAQAVLFHHRDLVKGPPDWPPPWGVQAHTAEEVDLRVLDY
.. . . :.. .:: : .:. :. :: :....: . ::
CCDS12 SEMVPGTADCHITADRKVYPQADMVIVHHWDIMSNPKSRLPP------------------
90 100 110 120
280 290 300 310 320 330
pF1KE2 EEAAAAAEALATSSPRPPGQRWVWMNFESPSHSPGLRSLASNLFNWTLSYRADSDVFVPY
:::: ::::.:.:.: : . :..: . :: :.:::.:::.:.::
CCDS12 -------------SPRPQGQRWIWFNLEPPPNCQHLEAL-DRYFNLTMSYRSDSDIFTPY
130 140 150 160
340 350 360 370 380
pF1KE2 GYLYPRS-HPGDPPSGLAPPLSRKQGLVAWVVSHWDERQARVRYYHQLSQHVTVDVFGRG
:.: : : .:. :: . :: : ::::.::.: .::::::..:. :. :::.::.
CCDS12 GWLEPWSGQPAHPPLN----LSAKTELVAWAVSNWKPDSARVRYYQSLQAHLKVDVYGRS
170 180 190 200 210 220
390 400 410 420 430 440
pF1KE2 GPGQPVPEIGLLHTVARYKFYLAFENSQHLDYITEKLWRNALLAGAVPVVLGPDRANYER
.:.:. ...:..::::::::::: : :::::::::::: : ::::::::.:.::::
CCDS12 H--KPLPKGTMMETLSRYKFYLAFENSLHPDYITEKLWRNALEAWAVPVVLGPSRSNYER
230 240 250 260 270 280
450 460 470 480 490 500
pF1KE2 FVPRGAFIHVDDFPSASSLASYLLFLDRNPAVYRRYFHWRRSYAVHITSF-WDEPWCRVC
:.: :::::::: : ..:: :: ::.. : : ::.::.. .. :: : .:..:
CCDS12 FLPPDAFIHVDDFQSPKDLARYLQELDKDHARYLSYFRWRET--LRPRSFSWALDFCKAC
290 300 310 320 330 340
510 520 530
pF1KE2 QAVQRAGDRPKSIRNLASWFER
.:. . : ...:..:.::
CCDS12 WKLQQES-RYQTVRSIAAWFT
350 360
>>CCDS12154.1 FUT5 gene_id:2527|Hs108|chr19 (374 aa)
initn: 854 init1: 411 opt: 855 Z-score: 795.8 bits: 156.4 E(32554): 5.2e-38
Smith-Waterman score: 917; 44.3% identity (66.3% similar) in 350 aa overlap (184-528:70-373)
160 170 180 190 200 210
pF1KE2 CVLAAAGLTCTALITYACWGQLPPLPWASPTPSRP-VGVLLWWEPFGGRDSAPRPPPDC-
::..: . .::: :: ..: : :
CCDS12 DATGSPRPGLMAVEPVTGAPNGSRCQDSMATPAHPTLLILLWTWPF----NTPVALPRCS
40 50 60 70 80 90
220 230 240 250 260 270
pF1KE2 RLRFNISGCRLLTDRASYGEAQAVLFHHRDLVKGPP-DWPPPWGVQAHTAEEVDLRVLDY
.. . . : . .: . : .:.::. :: :.. .: . :::
CCDS12 EMVPGAADCNITADSSVYPQADAVIVHHWDIMYNPSANLPPP------------------
100 110 120 130
280 290 300 310 320 330
pF1KE2 EEAAAAAEALATSSPRPPGQRWVWMNFESPSHSPGLRSLASNLFNWTLSYRADSDVFVPY
:: ::::.:...::::. :..: .. :: :.:::.:::.:.::
CCDS12 --------------TRPQGQRWIWFSMESPSNCRHLEAL-DGYFNLTMSYRSDSDIFTPY
140 150 160 170 180
340 350 360 370 380
pF1KE2 GYLYPRS-HPGDPPSGLAPPLSRKQGLVAWVVSHWDERQARVRYYHQLSQHVTVDVFGRG
:.: : : .:. :: . :: : ::::.::.: .::::::..:. :. :::.::.
CCDS12 GWLEPWSGQPAHPPLN----LSAKTELVAWAVSNWKPDSARVRYYQSLQAHLKVDVYGRS
190 200 210 220 230
390 400 410 420 430 440
pF1KE2 GPGQPVPEIGLLHTVARYKFYLAFENSQHLDYITEKLWRNALLAGAVPVVLGPDRANYER
.:.:. ...:..::::::::::: : :::::::::::: : ::::::::.:.::::
CCDS12 H--KPLPKGTMMETLSRYKFYLAFENSLHPDYITEKLWRNALEAWAVPVVLGPSRSNYER
240 250 260 270 280 290
450 460 470 480 490 500
pF1KE2 FVPRGAFIHVDDFPSASSLASYLLFLDRNPAVYRRYFHWRRSYAVHITSF-WDEPWCRVC
:.: :::::::: : ..:: :: ::.. : : :::::.. .. :: : .:..:
CCDS12 FLPPDAFIHVDDFQSPKDLARYLQELDKDHARYLSYFHWRET--LRPRSFSWALAFCKAC
300 310 320 330 340 350
510 520 530
pF1KE2 QAVQRAGDRPKSIRNLASWFER
.:. . : ...:..:.::
CCDS12 WKLQQES-RYQTVRSIAAWFT
360 370
>>CCDS12152.1 FUT6 gene_id:2528|Hs108|chr19 (359 aa)
initn: 843 init1: 401 opt: 850 Z-score: 791.4 bits: 155.6 E(32554): 9.2e-38
Smith-Waterman score: 898; 43.5% identity (64.9% similar) in 359 aa overlap (173-528:47-358)
150 160 170 180 190 200
pF1KE2 WRRGRGLPWTVCVLAAAGLTCTALITYACWGQLPPLPWASPTPSRPVGVLLWWEPFGGRD
:. : ..:. : :. .::: ::
CCDS12 LTTLLFQLLMAVCFFSYLRVSQDDPTVYPNGSRFPDSTGTPAHSIPL-ILLWTWPF----
20 30 40 50 60 70
210 220 230 240 250 260
pF1KE2 SAPRPPPDC-RLRFNISGCRLLTDRASYGEAQAVLFHHRDLVKGPPDWPPPWGVQAHTAE
. : : : .. . . : . .:: : .:.::. :::... .: :
CCDS12 NKPIALPRCSEMVPGTADCNITADRKVYPQADAVIVHHREVMYNPSAQLP----------
80 90 100 110 120
270 280 290 300 310 320
pF1KE2 EVDLRVLDYEEAAAAAEALATSSPRPPGQRWVWMNFESPSHSPGLRSLASNLFNWTLSYR
::: ::::.:...::::: :... .. :: :.:::
CCDS12 ---------------------RSPRRQGQRWIWFSMESPSHCWQLKAM-DGYFNLTMSYR
130 140 150
330 340 350 360 370 380
pF1KE2 ADSDVFVPYGYLYPRS-HPGDPPSGLAPPLSRKQGLVAWVVSHWDERQARVRYYHQLSQH
.:::.:.:::.: : : .:. :: .: : : ::::.::.: .::::::..:. :
CCDS12 SDSDIFTPYGWLEPWSGQPAHPPLNL----SAKTELVAWAVSNWGPNSARVRYYQSLQAH
160 170 180 190 200 210
390 400 410 420 430 440
pF1KE2 VTVDVFGRGGPGQPVPEIGLLHTVARYKFYLAFENSQHLDYITEKLWRNALLAGAVPVVL
. :::.::. .:.:. ...:..::::::::::: : :::::::::::: : ::::::
CCDS12 LKVDVYGRS--HKPLPQGTMMETLSRYKFYLAFENSLHPDYITEKLWRNALEAWAVPVVL
220 230 240 250 260 270
450 460 470 480 490
pF1KE2 GPDRANYERFVPRGAFIHVDDFPSASSLASYLLFLDRNPAVYRRYFHWRRSYAVHITSF-
::.:.:::::.: :::::::: : ..:: :: ::.. : : ::.::.. .. ::
CCDS12 GPSRSNYERFLPPDAFIHVDDFQSPKDLARYLQELDKDHARYLSYFRWRET--LRPRSFS
280 290 300 310 320 330
500 510 520 530
pF1KE2 WDEPWCRVCQAVQRAGDRPKSIRNLASWFER
: .:..: .:. . : .. :..:.::
CCDS12 WALAFCKACWKLQEES-RYQT-RGIAAWFT
340 350
>>CCDS7022.1 FUT7 gene_id:2529|Hs108|chr9 (342 aa)
initn: 763 init1: 354 opt: 732 Z-score: 682.8 bits: 135.4 E(32554): 1e-31
Smith-Waterman score: 928; 44.3% identity (62.9% similar) in 388 aa overlap (144-529:10-341)
120 130 140 150 160 170
pF1KE2 AWRAEAALPVRAMGAPWGSPTAAAGGRRGWRRGRGLPWTVCVLAAAGLTCTALITYACWG
:: ::: :::...: .:: . :
CCDS70 MNNAGHGPTRRLRGLG----VLAGVALL-AAL--WLLW-
10 20 30
180 190 200 210 220 230
pF1KE2 QLPPLPWASPTPSRPVGVLLWWEPFGGRDSAPRPPPDCRLRFNISGCRLLTDRASYGEAQ
: : ..:.:. . .:.: :: :. :. : : :..:. :.: ..:. . :.
CCDS70 LLGSAPRGTPAPQPTITILVWHWPF--TDQPPELPSDTCTRYGIARCHLSANRSLLASAD
40 50 60 70 80
240 250 260 270 280 290
pF1KE2 AVLFHHRDLVKGPPDWPPPWGVQAHTAEEVDLRVLDYEEAAAAAEALATSSPRPPGQRWV
::.::::.: : :: :: :: ::
CCDS70 AVVFHHRELQTRRSHLP-----------------------------LA---QRPRGQPWV
90 100 110
300 310 320 330 340 350
pF1KE2 WMNFESPSHSPGLRSLASNLFNWTLSYRADSDVFVPYGYLYPRSHPGDPPSGLAPPLSRK
: ..:::::. :: : ..:::.:::: :::.::::: : : : : :: ::: :
CCDS70 WASMESPSHTHGLSHL-RGIFNWVLSYRRDSDIFVPYGRLEP--HWG--PS---PPLPAK
120 130 140 150 160
360 370 380 390 400 410
pF1KE2 QGLVAWVVSHWDERQARVRYYHQLSQHVTVDVFGRGGPGQPVPEIGLLHTVARYKFYLAF
. ..:::::...::: :.: :.::. :. ::::::.. :.:. :. :::.:.:::.:
CCDS70 SRVAAWVVSNFQERQLRARLYRQLAPHLRVDVFGRAN-GRPLCASCLVPTVAQYRFYLSF
170 180 190 200 210 220
420 430 440 450 460 470
pF1KE2 ENSQHLDYITEKLWRNALLAGAVPVVLGPDRANYERFVPRGAFIHVDDFPSASSLASYLL
::::: ::::::.:::::.::.::::::: ::.:: ::: ::.::::: :: ::..:
CCDS70 ENSQHRDYITEKFWRNALVAGTVPVVLGPPRATYEAFVPADAFVHVDDFGSARELAAFLT
230 240 250 260 270 280
480 490 500 510 520 530
pF1KE2 FLDRNPAVYRRYFHWRRSYAVHITSFWDEPWCRVCQAVQRAGDRPKS--IRNLASWFER
. : . :.:.: :: :.. . : : .: .: .: :.: ..: .::.
CCDS70 GM--NESRYQRFFAWRDRLRVRLFTDWRERFCAIC---DRYPHLPRSQVYEDLEGWFQA
290 300 310 320 330 340
>>CCDS5033.1 FUT9 gene_id:10690|Hs108|chr6 (359 aa)
initn: 849 init1: 285 opt: 659 Z-score: 615.2 bits: 122.9 E(32554): 6e-28
Smith-Waterman score: 858; 41.7% identity (65.4% similar) in 338 aa overlap (191-528:66-357)
170 180 190 200 210 220
pF1KE2 LTCTALITYACWGQLPPLPWASPTPSRPVGVLLWWEPFGGRDSAPRPPPDCRLRFNISGC
.:.: ::: . .:. :::.::
CCDS50 WIFSPMESASSVLKMKNFFSTKTDYFNETTILVWVWPFGQTFDLT----SCQAMFNIQGC
40 50 60 70 80 90
230 240 250 260 270 280
pF1KE2 RLLTDRASYGEAQAVLFHHRDLVKGPPDWPPPWGVQAHTAEEVDLRVLDYEEAAAAAEAL
.: :::. :....:::.::::. .: :: : .
CCDS50 HLTTDRSLYNKSHAVLIHHRDI-----SW--------------DLTNLPQQA--------
100 110 120
290 300 310 320 330 340
pF1KE2 ATSSPRPPGQRWVWMNFESPSHSPGLRSLASNLFNWTLSYRADSDVFVPYGYLYPRSHPG
::: :.:.:::.:::.:.: .: .::: ::.:: :::. ::::.: ..:
CCDS50 -----RPPFQKWIWMNLESPTHTPQ-KSGIEHLFNLTLTYRRDSDIQVPYGFLTVSTNP-
130 140 150 160 170
350 360 370 380 390 400
pF1KE2 DPPSGLAPPLSRKQGLVAWVVSHWDERQARVRYYHQLSQHVTVDVFGRGGPGQPVPEIGL
.. . :. :: ::::.:. ..:::.::..::. . . ..:.. :. : . .:
CCDS50 -----FVFEVPSKEKLVCWVVSNWNPEHARVKYYNELSKSIEIHTYGQAF-GEYVNDKNL
180 190 200 210 220 230
410 420 430 440 450 460
pF1KE2 LHTVARYKFYLAFENSQHLDYITEKLWRNALLAGAVPVVLGPDRANYERFVPRGAFIHVD
. :.. ::::.:::: : :::::::. ::.:::.:::::::.: ::: ..: .::::.
CCDS50 IPTISTCKFYLSFENSIHKDYITEKLY-NAFLAGSVPVVLGPSRENYENYIPADSFIHVE
240 250 260 270 280 290
470 480 490 500 510 520
pF1KE2 DFPSASSLASYLLFLDRNPAVYRRYFHWRRSYAVHITSFWDEPWCRVCQAVQRAGDRPKS
:. : : ::.:: .:.: .: ::.::....:.. ::. : .:. :.: . ::
CCDS50 DYNSPSELAKYLKEVDKNNKLYLSYFNWRKDFTVNLPRFWESHACLACDHVKRHQEY-KS
300 310 320 330 340
530
pF1KE2 IRNLASWFER
. :: .::
CCDS50 VGNLEKWFWN
350
530 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Mon Nov 7 15:45:41 2016 done: Mon Nov 7 15:45:42 2016
Total Scan time: 4.080 Total Display time: 0.030
Function used was FASTA [36.3.4 Apr, 2011]