FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB3524, 460 aa
1>>>pF1KB3524 460 - 460 aa - 460 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 7.9048+/-0.000995; mu= 5.9487+/- 0.060
mean_var=151.5786+/-30.215, 0's: 0 Z-trim(109.0): 47 B-trim: 0 in 0/51
Lambda= 0.104173
statistics sampled from 10525 (10560) to 10525 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.668), E-opt: 0.2 (0.324), width: 16
Scan time: 3.360
The best scores are: opt bits E(32554)
CCDS14423.1 NAP1L2 gene_id:4674|Hs108|chrX ( 460) 3078 474.6 9.6e-134
CCDS76581.1 NAP1L1 gene_id:4673|Hs108|chr12 ( 383) 815 134.4 2e-31
CCDS9013.1 NAP1L1 gene_id:4673|Hs108|chr12 ( 391) 795 131.4 1.6e-30
CCDS81715.1 NAP1L1 gene_id:4673|Hs108|chr12 ( 328) 782 129.4 5.4e-30
CCDS41599.1 NAP1L4 gene_id:4676|Hs108|chr11 ( 375) 769 127.5 2.3e-29
CCDS14465.1 NAP1L3 gene_id:4675|Hs108|chrX ( 506) 607 103.2 6.4e-22
>>CCDS14423.1 NAP1L2 gene_id:4674|Hs108|chrX (460 aa)
initn: 3078 init1: 3078 opt: 3078 Z-score: 2514.6 bits: 474.6 E(32554): 9.6e-134
Smith-Waterman score: 3078; 100.0% identity (100.0% similar) in 460 aa overlap (1-460:1-460)
10 20 30 40 50 60
pF1KB3 MAESENRKELSESSQEEAGNQIMVEGLGEHLERGEDAAAGLGDDGKCGEEAAAGLGEEGE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 MAESENRKELSESSQEEAGNQIMVEGLGEHLERGEDAAAGLGDDGKCGEEAAAGLGEEGE
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB3 NGEDTAAGSGEDGKKGGDTDEDSEADRPKGLIGYVLDTDFVESLPVKVKYRVLALKKLQT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 NGEDTAAGSGEDGKKGGDTDEDSEADRPKGLIGYVLDTDFVESLPVKVKYRVLALKKLQT
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB3 RAANLESKFLREFHDIERKFAEMYQPLLEKRRQIINAIYEPTEEECEYKSDSEDCDDEEM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 RAANLESKFLREFHDIERKFAEMYQPLLEKRRQIINAIYEPTEEECEYKSDSEDCDDEEM
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB3 CHEEMYGNEEGMVHEYVDEDDGYEDYYYDYAVEEEEEEEEEDDIEATGEENKEEEDPKGI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 CHEEMYGNEEGMVHEYVDEDDGYEDYYYDYAVEEEEEEEEEDDIEATGEENKEEEDPKGI
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB3 PDFWLTVLKNVDTLTPLIKKYDEPILKLLTDIKVKLSDPGEPLSFTLEFHFKPNEYFKNE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 PDFWLTVLKNVDTLTPLIKKYDEPILKLLTDIKVKLSDPGEPLSFTLEFHFKPNEYFKNE
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB3 LLTKTYVLKSKLAYYDPHPYRGTAIEYSTGCEIDWNEGKNVTLKTIKKKQKHRIWGTIRT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 LLTKTYVLKSKLAYYDPHPYRGTAIEYSTGCEIDWNEGKNVTLKTIKKKQKHRIWGTIRT
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB3 VTEDFPKDSFFNFFSPHGITSNGRDGNDDFLLGHNLRTYIIPRSVLFFSGDALESQQEGV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS14 VTEDFPKDSFFNFFSPHGITSNGRDGNDDFLLGHNLRTYIIPRSVLFFSGDALESQQEGV
370 380 390 400 410 420
430 440 450 460
pF1KB3 VREVNDAIYDKIIYDNWMAAIEEVKACCKNLEALVEDIDR
::::::::::::::::::::::::::::::::::::::::
CCDS14 VREVNDAIYDKIIYDNWMAAIEEVKACCKNLEALVEDIDR
430 440 450 460
>>CCDS76581.1 NAP1L1 gene_id:4673|Hs108|chr12 (383 aa)
initn: 771 init1: 665 opt: 815 Z-score: 677.7 bits: 134.4 E(32554): 2e-31
Smith-Waterman score: 1043; 46.3% identity (66.7% similar) in 402 aa overlap (57-449:23-376)
30 40 50 60 70 80
pF1KB3 LGEHLERGEDAAAGLGDDGKCGEEAAAGLGEEGENGEDTAAGSGEDGKKGGDTDEDSEA-
:: :.::.: . . . .. . :
CCDS76 MADIDNKEQSELDQDLDDVEEVEEEETGEETKLKARQLTVQMMQNPQILAAL
10 20 30 40 50
90 100 110 120 130 140
pF1KB3 -DRPKGLIGYVLDTDFVESLPVKVKYRVLALKKLQTRAANLESKFLREFHDIERKFAEMY
.: ::. : ..:::: :: :: :::.::.. :..:.:: .: ::.:::.: .:
CCDS76 QERLDGLVE--TPTGYIESLPRVVKRRVNALKNLQVKCAQIEAKFYEEVHDLERKYAVLY
60 70 80 90 100 110
150 160 170 180 190 200
pF1KB3 QPLLEKRRQIINAIYEPTEEECEYKSDSEDCDDEEMCHEEMYGNEEGMVHEYVDEDDGYE
:::..:: .::::::::::::::.: : :: .::. .:.. .
CCDS76 QPLFDKRFEIINAIYEPTEEECEWKPDEEDEISEEL-------KEKAKI-----------
120 130 140 150
210 220 230 240 250 260
pF1KB3 DYYYDYAVEEEEEEEEEDDIEATGEENKEEEDPKGIPDFWLTVLKNVDTLTPLIKKYDEP
:.:..:. :.:::::::.:::::.:::: :. .....:::
CCDS76 ------------EDEKKDE---------EKEDPKGIPEFWLTVFKNVDLLSDMVQEHDEP
160 170 180 190
270 280 290 300 310 320
pF1KB3 ILKLLTDIKVKLSDPGEPLSFTLEFHFKPNEYFKNELLTKTYVLKSKLAYYDPHPYRGTA
::: : :::::.:: :.:.::.:::::.::::: ::.::::: ..:. :: . :
CCDS76 ILKHLKDIKVKFSDAGQPMSFVLEFHFEPNEYFTNEVLTKTYRMRSEPDDSDPFSFDGPE
200 210 220 230 240 250
330 340 350 360 370 380
pF1KB3 IEYSTGCEIDWNEGKNVTLKTIKKKQKHRIWGTIRTVTEDFPKDSFFNFFSPHGITSNGR
: :::.:::..:::::::::::::::. ::.::::. .:::::::.: . .:
CCDS76 IMGCTGCQIDWKKGKNVTLKTIKKKQKHKGRGTVRTVTKTVSNDSFFNFFAPPEVPESGD
260 270 280 290 300 310
390 400 410 420 430
pF1KB3 DGND-------DFLLGHNLRTYIIPRSVLFFSGDALESQQEGVVREVNDAIYDKIIYDNW
.: :: .:: :: :::::::.:.:.:.:.... .: ..: :.
CCDS76 LDDDAEAILAADFEIGHFLRERIIPRSVLYFTGEAIEDDDDDYDEEGEEA-------DEG
320 330 340 350 360
440 450 460
pF1KB3 MAAIEEVKACCKNLEALVEDIDR
. .::::.: :
CCDS76 YQLFEEVKSCSKLFQRWLQ
370 380
>>CCDS9013.1 NAP1L1 gene_id:4673|Hs108|chr12 (391 aa)
initn: 1082 init1: 656 opt: 795 Z-score: 661.4 bits: 131.4 E(32554): 1.6e-30
Smith-Waterman score: 1023; 47.1% identity (67.6% similar) in 380 aa overlap (57-427:23-361)
30 40 50 60 70 80
pF1KB3 LGEHLERGEDAAAGLGDDGKCGEEAAAGLGEEGENGEDTAAGSGEDGKKGGDTDEDSEA-
:: :.::.: . . . .. . :
CCDS90 MADIDNKEQSELDQDLDDVEEVEEEETGEETKLKARQLTVQMMQNPQILAAL
10 20 30 40 50
90 100 110 120 130 140
pF1KB3 -DRPKGLIGYVLDTDFVESLPVKVKYRVLALKKLQTRAANLESKFLREFHDIERKFAEMY
.: ::. : ..:::: :: :: :::.::.. :..:.:: .: ::.:::.: .:
CCDS90 QERLDGLVE--TPTGYIESLPRVVKRRVNALKNLQVKCAQIEAKFYEEVHDLERKYAVLY
60 70 80 90 100 110
150 160 170 180 190 200
pF1KB3 QPLLEKRRQIINAIYEPTEEECEYKSDSEDCDDEEMCHEEMYGNEEGMVHEYVDEDDGYE
:::..:: .::::::::::::::.: : :: .::. .:.. .
CCDS90 QPLFDKRFEIINAIYEPTEEECEWKPDEEDEISEEL-------KEKAKI-----------
120 130 140 150
210 220 230 240 250 260
pF1KB3 DYYYDYAVEEEEEEEEEDDIEATGEENKEEEDPKGIPDFWLTVLKNVDTLTPLIKKYDEP
:.:..:. :.:::::::.:::::.:::: :. .....:::
CCDS90 ------------EDEKKDE---------EKEDPKGIPEFWLTVFKNVDLLSDMVQEHDEP
160 170 180 190
270 280 290 300 310 320
pF1KB3 ILKLLTDIKVKLSDPGEPLSFTLEFHFKPNEYFKNELLTKTYVLKSKLAYYDPHPYRGTA
::: : :::::.:: :.:.::.:::::.::::: ::.::::: ..:. :: . :
CCDS90 ILKHLKDIKVKFSDAGQPMSFVLEFHFEPNEYFTNEVLTKTYRMRSEPDDSDPFSFDGPE
200 210 220 230 240 250
330 340 350 360 370 380
pF1KB3 IEYSTGCEIDWNEGKNVTLKTIKKKQKHRIWGTIRTVTEDFPKDSFFNFFSPHGITSNGR
: :::.:::..:::::::::::::::. ::.::::. .:::::::.: . .:
CCDS90 IMGCTGCQIDWKKGKNVTLKTIKKKQKHKGRGTVRTVTKTVSNDSFFNFFAPPEVPESGD
260 270 280 290 300 310
390 400 410 420 430
pF1KB3 DGND-------DFLLGHNLRTYIIPRSVLFFSGDALESQQEGVVREVNDAIYDKIIYDNW
.: :: .:: :: :::::::.:.:.:.:.... .: ..:
CCDS90 LDDDAEAILAADFEIGHFLRERIIPRSVLYFTGEAIEDDDDDYDEEGEEADEEGEEEGDE
320 330 340 350 360 370
440 450 460
pF1KB3 MAAIEEVKACCKNLEALVEDIDR
CCDS90 ENDPDYDPKKDQNPAECKQQ
380 390
>>CCDS81715.1 NAP1L1 gene_id:4673|Hs108|chr12 (328 aa)
initn: 1066 init1: 656 opt: 782 Z-score: 651.9 bits: 129.4 E(32554): 5.4e-30
Smith-Waterman score: 1003; 49.4% identity (70.1% similar) in 334 aa overlap (101-427:4-298)
80 90 100 110 120 130
pF1KB3 EDGKKGGDTDEDSEADRPKGLIGYVLDTDFVESLPVKVKYRVLALKKLQTRAANLESKFL
...:: :: :: :::.::.. :..:.::
CCDS81 MADIDNLPRVVKRRVNALKNLQVKCAQIEAKFY
10 20 30
140 150 160 170 180 190
pF1KB3 REFHDIERKFAEMYQPLLEKRRQIINAIYEPTEEECEYKSDSEDCDDEEMCHEEMYGNEE
.: ::.:::.: .::::..:: .::::::::::::::.: : :: .::.
CCDS81 EEVHDLERKYAVLYQPLFDKRFEIINAIYEPTEEECEWKPDEEDEISEEL----------
40 50 60 70 80
200 210 220 230 240 250
pF1KB3 GMVHEYVDEDDGYEDYYYDYAVEEEEEEEEEDDIEATGEENKEEEDPKGIPDFWLTVLKN
.:. . ::. ....:.:::::::.:::::.::
CCDS81 ------------------------KEKAKIEDE-----KKDEEKEDPKGIPEFWLTVFKN
90 100 110
260 270 280 290 300 310
pF1KB3 VDTLTPLIKKYDEPILKLLTDIKVKLSDPGEPLSFTLEFHFKPNEYFKNELLTKTYVLKS
:: :. .....:::::: : :::::.:: :.:.::.:::::.::::: ::.::::: ..:
CCDS81 VDLLSDMVQEHDEPILKHLKDIKVKFSDAGQPMSFVLEFHFEPNEYFTNEVLTKTYRMRS
120 130 140 150 160 170
320 330 340 350 360 370
pF1KB3 KLAYYDPHPYRGTAIEYSTGCEIDWNEGKNVTLKTIKKKQKHRIWGTIRTVTEDFPKDSF
. :: . : : :::.:::..:::::::::::::::. ::.::::. .:::
CCDS81 EPDDSDPFSFDGPEIMGCTGCQIDWKKGKNVTLKTIKKKQKHKGRGTVRTVTKTVSNDSF
180 190 200 210 220 230
380 390 400 410 420
pF1KB3 FNFFSPHGITSNGRDGND-------DFLLGHNLRTYIIPRSVLFFSGDALESQQEGVVRE
::::.: . .: .: :: .:: :: :::::::.:.:.:.:.... .:
CCDS81 FNFFAPPEVPESGDLDDDAEAILAADFEIGHFLRERIIPRSVLYFTGEAIEDDDDDYDEE
240 250 260 270 280 290
430 440 450 460
pF1KB3 VNDAIYDKIIYDNWMAAIEEVKACCKNLEALVEDIDR
..:
CCDS81 GEEADEEGEEEGDEENDPDYDPKKDQNPAECKQQ
300 310 320
>>CCDS41599.1 NAP1L4 gene_id:4676|Hs108|chr11 (375 aa)
initn: 1011 init1: 659 opt: 769 Z-score: 640.5 bits: 127.5 E(32554): 2.3e-29
Smith-Waterman score: 932; 45.8% identity (71.1% similar) in 325 aa overlap (98-414:53-341)
70 80 90 100 110 120
pF1KB3 GSGEDGKKGGDTDEDSEADRPKGLIGYVLDTDFVESLPVKVKYRVLALKKLQTRAANLES
....:.:: :: :. :::.::.: :..:.
CCDS41 NTEKLTDQVMQNPRVLAALQERLDNVPHTPSSYIETLPKAVKRRINALKQLQVRCAHIEA
30 40 50 60 70 80
130 140 150 160 170 180
pF1KB3 KFLREFHDIERKFAEMYQPLLEKRRQIINAIYEPTEEECEYKSDSEDCDDEEMCHEEMYG
:: .: ::.:::.: .::::..:::..:.. :::. : :..:..:. .:.. :
CCDS41 KFYEEVHDLERKYAALYQPLFDKRREFITGDVEPTDAESEWHSENEE-------EEKLAG
90 100 110 120 130
190 200 210 220 230 240
pF1KB3 NEEGMVHEYVDEDDGYEDYYYDYAVEEEEEEEEEDDIEATGEENKEEEDPKGIPDFWLTV
. .. : .: :. ::.:: ::::::.::.:.
CCDS41 DMKSKV-----------------VVTEKAA--------ATAEE----PDPKGIPEFWFTI
140 150 160
250 260 270 280 290 300
pF1KB3 LKNVDTLTPLIKKYDEPILKLLTDIKVKLSDPGEPLSFTLEFHFKPNEYFKNELLTKTYV
..::: :. :...::::::: : :::::.::::.:.::.:::::.::.:: : .:::::
CCDS41 FRNVDMLSELVQEYDEPILKHLQDIKVKFSDPGQPMSFVLEFHFEPNDYFTNSVLTKTYK
170 180 190 200 210 220
310 320 330 340 350 360
pF1KB3 LKSKLAYYDPHPYRGTAIEYSTGCEIDWNEGKNVTLKTIKKKQKHRIWGTIRTVTEDFPK
.::. :: ..: : :: :::..:::::.:::::::::. ::.::.:.. :.
CCDS41 MKSEPDKADPFSFEGPEIVDCDGCTIDWKKGKNVTVKTIKKKQKHKGRGTVRTITKQVPN
230 240 250 260 270 280
370 380 390 400 410
pF1KB3 DSFFNFFSPHGITSNGRDGNDD--------FLLGHNLRTYIIPRSVLFFSGDALESQQEG
.::::::.: ...:.. ..: : .:: .: :.::.::.:.:.:.:
CCDS41 ESFFNFFNPLKASGDGESLDEDSEFTLASDFEIGHFFRERIVPRAVLYFTGEAIEDDDNF
290 300 310 320 330 340
420 430 440 450 460
pF1KB3 VVREVNDAIYDKIIYDNWMAAIEEVKACCKNLEALVEDIDR
CCDS41 EEGEEGEEEELEGDEEGEDEDDAEINPKV
350 360 370
>>CCDS14465.1 NAP1L3 gene_id:4675|Hs108|chrX (506 aa)
initn: 910 init1: 503 opt: 607 Z-score: 507.0 bits: 103.2 E(32554): 6.4e-22
Smith-Waterman score: 756; 35.3% identity (58.0% similar) in 436 aa overlap (65-411:54-487)
40 50 60 70 80 90
pF1KB3 EDAAAGLGDDGKCGEEAAAGLGEEGENGEDTAAGSGEDGKKGGDTDEDSEADRPKGLIGY
...::: .....:.:. :. : : .
CCDS14 SSTSDSGEESDSSSSSSSTSDSSSSSSTSGSSSGSGSSSSSSGSTSSRSRLYRKKRVPEP
30 40 50 60 70 80
100 110 120 130 140
pF1KB3 V-------LDTDFVESLPVKVKYRVLALKKLQTRAANLESKFLREFHDIERKFAEMYQPL
: :.::. :: :. :: ::...: . .... ::. .::.:::.::. .::
CCDS14 SRRARRAPLGTNFVDRLPQAVRNRVQALRNIQDECDKVDTLFLKAIHDLERKYAELNKPL
90 100 110 120 130 140
150 160 170 180 190
pF1KB3 LEKRRQIINAIYEPTEEECEYKSDSEDCDDEEMCHEE-------MYGNEE----------
..: ::::: :::::::::..:..:. ...: ... . :.::
CCDS14 YDRRFQIINAEYEPTEEECEWNSEDEEFSSDEEVQDNTPSEMPPLEGEEEENPKENPEVK
150 160 170 180 190 200
200 210 220 230
pF1KB3 ---GMVHEYVDE--DDGYEDYYYDYAVEEEEEEEEEDDIEATGE-------------ENK
: . . : :. : :. ::. . .: .::: : ..:
CCDS14 AEEKEVPKEIPEVKDEEKEVPKEIPEVKAEEKADSKDCMEATPEVKEDPKEVPQVKADDK
210 220 230 240 250 260
240 250
pF1KB3 EE----------------------------------------EDPKGIPDFWLTVLKNVD
:. ::::::::.:: ::::::
CCDS14 EQPKATEAKARAAVRETHKRVPEERLQDSVDLKRARKGKPKREDPKGIPDYWLIVLKNVD
270 280 290 300 310 320
260 270 280 290 300 310
pF1KB3 TLTPLIKKYDEPILKLLTDIKVKLSDPGEPLSFTLEFHFKPNEYFKNELLTKTYVLKSKL
: :.:.::::::::.:.:...:.: ::.:.:.:.:::: :: ::.::.:.:::..:.:
CCDS14 KLGPMIQKYDEPILKFLSDVSLKFSKPGQPVSYTFEFHFLPNPYFRNEVLVKTYIIKAKP
330 340 350 360 370 380
320 330 340 350 360 370
pF1KB3 AYYDPHPYRGTAIEYSTGCEIDWNEGKNVTLKTIKKKQKHRIWGTIRTVTEDFPKDSFFN
. :: : :: ::.::: .::.::. : ... : :. . :. ::::
CCDS14 DHNDPFFSWGWEIEDCKGCKIDWRRGKDVTVTTTQSRTTAT--GEIEIQPRVVPNASFFN
390 400 410 420 430 440
380 390 400 410 420
pF1KB3 FFSPHGITSNGR-----DG--NDDFLLGHNLRTYIIPRSVLFFSGDALESQQEGVVREVN
:::: : :. :. ..:: .:. :. .: .:. ...:.
CCDS14 FFSPPEIPMIGKLEPREDAILDEDFEIGQILHDNVILKSIYYYTGEVNGTYYQFGKHYGN
450 460 470 480 490 500
430 440 450 460
pF1KB3 DAIYDKIIYDNWMAAIEEVKACCKNLEALVEDIDR
CCDS14 KKYRK
460 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Sat Nov 5 12:16:28 2016 done: Sat Nov 5 12:16:28 2016
Total Scan time: 3.360 Total Display time: 0.030
Function used was FASTA [36.3.4 Apr, 2011]