FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE3205, 476 aa
1>>>pF1KE3205 476 - 476 aa - 476 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 5.6315+/-0.000782; mu= 16.5847+/- 0.047
mean_var=69.9727+/-13.977, 0's: 0 Z-trim(108.4): 11 B-trim: 66 in 1/50
Lambda= 0.153324
statistics sampled from 10198 (10205) to 10198 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.679), E-opt: 0.2 (0.313), width: 16
Scan time: 3.330
The best scores are: opt bits E(32554)
CCDS10425.1 NARFL gene_id:64428|Hs108|chr16 ( 476) 3222 721.7 4.3e-208
CCDS76798.1 NARFL gene_id:64428|Hs108|chr16 ( 374) 2556 574.3 7.7e-164
CCDS32777.1 NARF gene_id:26502|Hs108|chr17 ( 456) 1465 333.0 4e-91
CCDS42404.1 NARF gene_id:26502|Hs108|chr17 ( 397) 1372 312.4 5.6e-85
CCDS42403.1 NARF gene_id:26502|Hs108|chr17 ( 408) 1322 301.3 1.2e-81
>>CCDS10425.1 NARFL gene_id:64428|Hs108|chr16 (476 aa)
initn: 3222 init1: 3222 opt: 3222 Z-score: 3849.5 bits: 721.7 E(32554): 4.3e-208
Smith-Waterman score: 3222; 100.0% identity (100.0% similar) in 476 aa overlap (1-476:1-476)
10 20 30 40 50 60
pF1KE3 MASPFSGALQLTDLDDFIGPSQECIKPVKVEKRAGSGVAKIRIEDDGSYFQINQDGGTRR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 MASPFSGALQLTDLDDFIGPSQECIKPVKVEKRAGSGVAKIRIEDDGSYFQINQDGGTRR
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE3 LEKAKVSLNDCLACSGCITSAETVLITQQSHEELKKVLDANKMAAPSQQRLVVVSVSPQS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 LEKAKVSLNDCLACSGCITSAETVLITQQSHEELKKVLDANKMAAPSQQRLVVVSVSPQS
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE3 RASLAARFQLNPTDTARKLTSFFKKIGVHFVFDTAFSRHFSLLESQREFVRRFRGQADCR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 RASLAARFQLNPTDTARKLTSFFKKIGVHFVFDTAFSRHFSLLESQREFVRRFRGQADCR
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE3 QALPLLASACPGWICYAEKTHGSFILPHISTARSPQQVMGSLVKDFFAQQQHLTPDKIYH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 QALPLLASACPGWICYAEKTHGSFILPHISTARSPQQVMGSLVKDFFAQQQHLTPDKIYH
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE3 VTVMPCYDKKLEASRPDFFNQEHQTRDVDCVLTTGEVFRLLEEEGVSLPDLEPAPLDSLC
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 VTVMPCYDKKLEASRPDFFNQEHQTRDVDCVLTTGEVFRLLEEEGVSLPDLEPAPLDSLC
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE3 SGASAEEPTSHRGGGSGGYLEHVFRHAARELFGIHVAEVTYKPLRNKDFQEVTLEKEGQV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 SGASAEEPTSHRGGGSGGYLEHVFRHAARELFGIHVAEVTYKPLRNKDFQEVTLEKEGQV
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE3 LLHFAMAYGFRNIQNLVQRLKRGRCPYHYVEVMACPSGCLNGGGQLQAPDRPSRELLQHV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 LLHFAMAYGFRNIQNLVQRLKRGRCPYHYVEVMACPSGCLNGGGQLQAPDRPSRELLQHV
370 380 390 400 410 420
430 440 450 460 470
pF1KE3 ERLYGMVRAEAPEDAPGVQELYTHWLQGTDSECAGRLLHTQYHAVEKASTGLGIRW
::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 ERLYGMVRAEAPEDAPGVQELYTHWLQGTDSECAGRLLHTQYHAVEKASTGLGIRW
430 440 450 460 470
>>CCDS76798.1 NARFL gene_id:64428|Hs108|chr16 (374 aa)
initn: 2556 init1: 2556 opt: 2556 Z-score: 3054.9 bits: 574.3 E(32554): 7.7e-164
Smith-Waterman score: 2556; 100.0% identity (100.0% similar) in 374 aa overlap (103-476:1-374)
80 90 100 110 120 130
pF1KE3 ACSGCITSAETVLITQQSHEELKKVLDANKMAAPSQQRLVVVSVSPQSRASLAARFQLNP
::::::::::::::::::::::::::::::
CCDS76 MAAPSQQRLVVVSVSPQSRASLAARFQLNP
10 20 30
140 150 160 170 180 190
pF1KE3 TDTARKLTSFFKKIGVHFVFDTAFSRHFSLLESQREFVRRFRGQADCRQALPLLASACPG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS76 TDTARKLTSFFKKIGVHFVFDTAFSRHFSLLESQREFVRRFRGQADCRQALPLLASACPG
40 50 60 70 80 90
200 210 220 230 240 250
pF1KE3 WICYAEKTHGSFILPHISTARSPQQVMGSLVKDFFAQQQHLTPDKIYHVTVMPCYDKKLE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS76 WICYAEKTHGSFILPHISTARSPQQVMGSLVKDFFAQQQHLTPDKIYHVTVMPCYDKKLE
100 110 120 130 140 150
260 270 280 290 300 310
pF1KE3 ASRPDFFNQEHQTRDVDCVLTTGEVFRLLEEEGVSLPDLEPAPLDSLCSGASAEEPTSHR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS76 ASRPDFFNQEHQTRDVDCVLTTGEVFRLLEEEGVSLPDLEPAPLDSLCSGASAEEPTSHR
160 170 180 190 200 210
320 330 340 350 360 370
pF1KE3 GGGSGGYLEHVFRHAARELFGIHVAEVTYKPLRNKDFQEVTLEKEGQVLLHFAMAYGFRN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS76 GGGSGGYLEHVFRHAARELFGIHVAEVTYKPLRNKDFQEVTLEKEGQVLLHFAMAYGFRN
220 230 240 250 260 270
380 390 400 410 420 430
pF1KE3 IQNLVQRLKRGRCPYHYVEVMACPSGCLNGGGQLQAPDRPSRELLQHVERLYGMVRAEAP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS76 IQNLVQRLKRGRCPYHYVEVMACPSGCLNGGGQLQAPDRPSRELLQHVERLYGMVRAEAP
280 290 300 310 320 330
440 450 460 470
pF1KE3 EDAPGVQELYTHWLQGTDSECAGRLLHTQYHAVEKASTGLGIRW
::::::::::::::::::::::::::::::::::::::::::::
CCDS76 EDAPGVQELYTHWLQGTDSECAGRLLHTQYHAVEKASTGLGIRW
340 350 360 370
>>CCDS32777.1 NARF gene_id:26502|Hs108|chr17 (456 aa)
initn: 1438 init1: 823 opt: 1465 Z-score: 1749.4 bits: 333.0 E(32554): 4e-91
Smith-Waterman score: 1465; 48.1% identity (77.0% similar) in 457 aa overlap (22-476:9-456)
10 20 30 40 50
pF1KE3 MASPFSGALQLTDLDDFIGPSQECIKPVKVEKRAGSGVAKIRIEDDGSYFQINQDGGT-R
.:: : .:.. . . .. : : : : . : .
CCDS32 MKCEHCTRKECSKKTKTDDQENVSA------DAPSPAQENGEKGEFH
10 20 30 40
60 70 80 90 100 110
pF1KE3 RLEKAKVSLNDCLACSGCITSAETVLITQQSHEELKKVLDANKMAAPSQQRLVVVSVSPQ
.: ::. :.:::::..:.:. : : ..::. ... .::. :: :.....:::: ::
CCDS32 KLADAKIFLSDCLACDSCMTAEEGVQLSQQNAKDFFRVLNLNKKCDTSKHKVLVVSVCPQ
50 60 70 80 90 100
120 130 140 150 160 170
pF1KE3 SRASLAARFQLNPTDTARKLTSFFKKIGVHFVFDTAFSRHFSLLESQREFVRRFRGQADC
: .::.:.:. ::..:.: .:.:..:::.::::... ::.::::.:::::.: ...
CCDS32 SLPYFAAKFNLSVTDASRRLCGFLKSLGVHYVFDTTIAADFSILESQKEFVRRYRQHSEE
110 120 130 140 150 160
180 190 200 210 220 230
pF1KE3 RQALPLLASACPGWICYAEKTHGSFILPHISTARSPQQVMGSLVKDFFAQQQHLTPDKIY
...::.:.::::::. :::.. : : :. ::.::::::::::::.::.::.:.:.::.
CCDS32 ERTLPMLTSACPGWVRYAERVLGRPITAHLCTAKSPQQVMGSLVKDYFARQQNLSPEKIF
170 180 190 200 210 220
240 250 260 270 280 290
pF1KE3 HVTVMPCYDKKLEASRPDFFNQEHQTRDVDCVLTTGEVFRLLEEEGVSLPDLEPAPLDSL
:: : ::::::::: . .. : .: .:::::.::. ...:. .:. : : .:.:
CCDS32 HVIVAPCYDKKLEALQESLPPALHGSRGADCVLTSGEIAQIMEQGDLSVRD---AAVDTL
230 240 250 260 270
300 310 320 330 340 350
pF1KE3 CSGASAEEPTSHRGGGSGGYLEHVFRHAARELFGIHVAEVTYKPLRNKDFQEVTLEKEGQ
. . .. : : :..: :.: :.:::::.:::. : ::::. :::::::::::::.:.
CCDS32 FGDLKEDKVTRHDGASSDGHLAHIFRHAAKELFNEDVEEVTYRALRNKDFQEVTLEKNGE
280 290 300 310 320 330
360 370 380 390 400 410
pF1KE3 VLLHFAMAYGFRNIQNLVQRLKRGRCPYHYVEVMACPSGCLNGGGQLQAPD-RPSRELLQ
:.:.:: :::::::::.. .::.:. :.:.:::.:: .::::: :: :.:: . .. ::.
CCDS32 VVLRFAAAYGFRNIQNMILKLKKGKFPFHFVEVLACAGGCLNGRGQAQTPDGHADKALLR
340 350 360 370 380 390
420 430 440 450 460 470
pF1KE3 HVERLYGMVRAEAPEDAPGVQELYTHWLQGTDSECAGRLLHTQYHAVEKASTGLGIRW
..: .:. . .. ::.. ::::: .::.: .: : ..::: :.. :... .: :.:
CCDS32 QMEGIYADIPVRRPESSAHVQELYQEWLEGINSPKAREVLHTTYQSQERGTHSLDIKW
400 410 420 430 440 450
>>CCDS42404.1 NARF gene_id:26502|Hs108|chr17 (397 aa)
initn: 1357 init1: 742 opt: 1372 Z-score: 1639.1 bits: 312.4 E(32554): 5.6e-85
Smith-Waterman score: 1372; 50.2% identity (79.5% similar) in 400 aa overlap (78-476:1-397)
50 60 70 80 90 100
pF1KE3 SYFQINQDGGTRRLEKAKVSLNDCLACSGCITSAETVLITQQSHEELKKVLDANKMAAPS
.:. : : ..::. ... .::. :: :
CCDS42 MTAEEGVQLSQQNAKDFFRVLNLNKKCDTS
10 20 30
110 120 130 140 150 160
pF1KE3 QQRLVVVSVSPQSRASLAARFQLNPTDTARKLTSFFKKIGVHFVFDTAFSRHFSLLESQR
.....:::: ::: .::.:.:. ::..:.: .:.:..:::.::::... ::.::::.
CCDS42 KHKVLVVSVCPQSLPYFAAKFNLSVTDASRRLCGFLKSLGVHYVFDTTIAADFSILESQK
40 50 60 70 80 90
170 180 190 200 210 220
pF1KE3 EFVRRFRGQADCRQALPLLASACPGWICYAEKTHGSFILPHISTARSPQQVMGSLVKDFF
:::::.: ... ...::.:.::::::. :::.. : : :. ::.::::::::::::.:
CCDS42 EFVRRYRQHSEEERTLPMLTSACPGWVRYAERVLGRPITAHLCTAKSPQQVMGSLVKDYF
100 110 120 130 140 150
230 240 250 260 270 280
pF1KE3 AQQQHLTPDKIYHVTVMPCYDKKLEASRPDFFNQEHQTRDVDCVLTTGEVFRLLEEEGVS
:.::.:.:.::.:: : ::::::::: . .. : .: .:::::.::. ...:. .:
CCDS42 ARQQNLSPEKIFHVIVAPCYDKKLEALQESLPPALHGSRGADCVLTSGEIAQIMEQGDLS
160 170 180 190 200 210
290 300 310 320 330 340
pF1KE3 LPDLEPAPLDSLCSGASAEEPTSHRGGGSGGYLEHVFRHAARELFGIHVAEVTYKPLRNK
. : : .:.: . . .. : : :..: :.: :.:::::.:::. : ::::. ::::
CCDS42 VRD---AAVDTLFGDLKEDKVTRHDGASSDGHLAHIFRHAAKELFNEDVEEVTYRALRNK
220 230 240 250 260
350 360 370 380 390 400
pF1KE3 DFQEVTLEKEGQVLLHFAMAYGFRNIQNLVQRLKRGRCPYHYVEVMACPSGCLNGGGQLQ
:::::::::.:.:.:.:: :::::::::.. .::.:. :.:.:::.:: .::::: :: :
CCDS42 DFQEVTLEKNGEVVLRFAAAYGFRNIQNMILKLKKGKFPFHFVEVLACAGGCLNGRGQAQ
270 280 290 300 310 320
410 420 430 440 450 460
pF1KE3 APD-RPSRELLQHVERLYGMVRAEAPEDAPGVQELYTHWLQGTDSECAGRLLHTQYHAVE
.:: . .. ::...: .:. . .. ::.. ::::: .::.: .: : ..::: :.. :
CCDS42 TPDGHADKALLRQMEGIYADIPVRRPESSAHVQELYQEWLEGINSPKAREVLHTTYQSQE
330 340 350 360 370 380
470
pF1KE3 KASTGLGIRW
... .: :.:
CCDS42 RGTHSLDIKW
390
>>CCDS42403.1 NARF gene_id:26502|Hs108|chr17 (408 aa)
initn: 1306 init1: 691 opt: 1322 Z-score: 1579.2 bits: 301.3 E(32554): 1.2e-81
Smith-Waterman score: 1322; 48.4% identity (76.8% similar) in 409 aa overlap (71-476:3-408)
50 60 70 80 90
pF1KE3 IRIEDDGSYFQINQDGGTRRLEKAKVSLNDCLACSGCITSAETVLITQQ--SHEELKKVL
: :. : .: :. : . . .
CCDS42 MKCEHCTRKECSKKTKTDDQENVSADAPSPAQ
10 20 30
100 110 120 130 140 150
pF1KE3 DANKMAAPSQQRLVVVSVSPQSRASLAARFQLNPTDTARKLTSFFKKIGVHFVFDTAFSR
. .. :.....:::: ::: .::.:.:. ::..:.: .:.:..:::.::::...
CCDS42 ENGEKCDTSKHKVLVVSVCPQSLPYFAAKFNLSVTDASRRLCGFLKSLGVHYVFDTTIAA
40 50 60 70 80 90
160 170 180 190 200 210
pF1KE3 HFSLLESQREFVRRFRGQADCRQALPLLASACPGWICYAEKTHGSFILPHISTARSPQQV
::.::::.:::::.: ... ...::.:.::::::. :::.. : : :. ::.:::::
CCDS42 DFSILESQKEFVRRYRQHSEEERTLPMLTSACPGWVRYAERVLGRPITAHLCTAKSPQQV
100 110 120 130 140 150
220 230 240 250 260 270
pF1KE3 MGSLVKDFFAQQQHLTPDKIYHVTVMPCYDKKLEASRPDFFNQEHQTRDVDCVLTTGEVF
:::::::.::.::.:.:.::.:: : ::::::::: . .. : .: .:::::.::.
CCDS42 MGSLVKDYFARQQNLSPEKIFHVIVAPCYDKKLEALQESLPPALHGSRGADCVLTSGEIA
160 170 180 190 200 210
280 290 300 310 320 330
pF1KE3 RLLEEEGVSLPDLEPAPLDSLCSGASAEEPTSHRGGGSGGYLEHVFRHAARELFGIHVAE
...:. .:. : : .:.: . . .. : : :..: :.: :.:::::.:::. : :
CCDS42 QIMEQGDLSVRD---AAVDTLFGDLKEDKVTRHDGASSDGHLAHIFRHAAKELFNEDVEE
220 230 240 250 260
340 350 360 370 380 390
pF1KE3 VTYKPLRNKDFQEVTLEKEGQVLLHFAMAYGFRNIQNLVQRLKRGRCPYHYVEVMACPSG
:::. :::::::::::::.:.:.:.:: :::::::::.. .::.:. :.:.:::.:: .:
CCDS42 VTYRALRNKDFQEVTLEKNGEVVLRFAAAYGFRNIQNMILKLKKGKFPFHFVEVLACAGG
270 280 290 300 310 320
400 410 420 430 440 450
pF1KE3 CLNGGGQLQAPD-RPSRELLQHVERLYGMVRAEAPEDAPGVQELYTHWLQGTDSECAGRL
:::: :: :.:: . .. ::...: .:. . .. ::.. ::::: .::.: .: : ..
CCDS42 CLNGRGQAQTPDGHADKALLRQMEGIYADIPVRRPESSAHVQELYQEWLEGINSPKAREV
330 340 350 360 370 380
460 470
pF1KE3 LHTQYHAVEKASTGLGIRW
::: :.. :... .: :.:
CCDS42 LHTTYQSQERGTHSLDIKW
390 400
476 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Sat Nov 5 23:39:04 2016 done: Sat Nov 5 23:39:04 2016
Total Scan time: 3.330 Total Display time: 0.030
Function used was FASTA [36.3.4 Apr, 2011]