FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE3181, 418 aa
1>>>pF1KE3181 418 - 418 aa - 418 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 5.8603+/-0.00085; mu= 14.7544+/- 0.051
mean_var=76.5875+/-15.543, 0's: 0 Z-trim(107.8): 19 B-trim: 0 in 0/50
Lambda= 0.146553
statistics sampled from 9808 (9815) to 9808 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.676), E-opt: 0.2 (0.301), width: 16
Scan time: 2.780
The best scores are: opt bits E(32554)
CCDS1876.1 PELI1 gene_id:57162|Hs108|chr2 ( 418) 2921 627.0 1e-179
CCDS9726.1 PELI2 gene_id:57161|Hs108|chr14 ( 420) 2481 533.9 1.1e-151
CCDS41675.1 PELI3 gene_id:246330|Hs108|chr11 ( 445) 2138 461.4 7.5e-130
CCDS31615.1 PELI3 gene_id:246330|Hs108|chr11 ( 469) 2040 440.7 1.4e-123
CCDS73328.1 PELI3 gene_id:246330|Hs108|chr11 ( 406) 1894 409.8 2.4e-114
>>CCDS1876.1 PELI1 gene_id:57162|Hs108|chr2 (418 aa)
initn: 2921 init1: 2921 opt: 2921 Z-score: 3339.8 bits: 627.0 E(32554): 1e-179
Smith-Waterman score: 2921; 100.0% identity (100.0% similar) in 418 aa overlap (1-418:1-418)
10 20 30 40 50 60
pF1KE3 MFSPDQENHPSKAPVKYGELIVLGYNGSLPNGDRGRRKSRFALFKRPKANGVKPSTVHIA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS18 MFSPDQENHPSKAPVKYGELIVLGYNGSLPNGDRGRRKSRFALFKRPKANGVKPSTVHIA
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE3 CTPQAAKAISNKDQHSISYTLSRAQTVVVEYTHDSNTDMFQIGRSTESPIDFVVTDTVPG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS18 CTPQAAKAISNKDQHSISYTLSRAQTVVVEYTHDSNTDMFQIGRSTESPIDFVVTDTVPG
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE3 SQSNSDTQSVQSTISRFACRIICERNPPFTARIYAAGFDSSKNIFLGEKAAKWKTSDGQM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS18 SQSNSDTQSVQSTISRFACRIICERNPPFTARIYAAGFDSSKNIFLGEKAAKWKTSDGQM
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE3 DGLTTNGVLVMHPRNGFTEDSKPGIWREISVCGNVFSLRETRSAQQRGKMVEIETNQLQD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS18 DGLTTNGVLVMHPRNGFTEDSKPGIWREISVCGNVFSLRETRSAQQRGKMVEIETNQLQD
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE3 GSLIDLCGATLLWRTAEGLSHTPTVKHLEALRQEINAARPQCPVGFNTLAFPSMKRKDVV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS18 GSLIDLCGATLLWRTAEGLSHTPTVKHLEALRQEINAARPQCPVGFNTLAFPSMKRKDVV
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE3 DEKQPWVYLNCGHVHGYHNWGNKEERDGKDRECPMCRSVGPYVPLWLGCEAGFYVDAGPP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS18 DEKQPWVYLNCGHVHGYHNWGNKEERDGKDRECPMCRSVGPYVPLWLGCEAGFYVDAGPP
310 320 330 340 350 360
370 380 390 400 410
pF1KE3 THAFSPCGHVCSEKTTAYWSQIPLPHGTHTFHAACPFCAHQLAGEQGYIRLIFQGPLD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS18 THAFSPCGHVCSEKTTAYWSQIPLPHGTHTFHAACPFCAHQLAGEQGYIRLIFQGPLD
370 380 390 400 410
>>CCDS9726.1 PELI2 gene_id:57161|Hs108|chr14 (420 aa)
initn: 2515 init1: 2427 opt: 2481 Z-score: 2837.0 bits: 533.9 E(32554): 1.1e-151
Smith-Waterman score: 2481; 81.4% identity (94.8% similar) in 420 aa overlap (1-418:1-420)
10 20 30 40 50
pF1KE3 MFSPDQENH--PSKAPVKYGELIVLGYNGSLPNGDRGRRKSRFALFKRPKANGVKPSTVH
:::: ::.: :.: :::::::.::::::.:::::::::::::::.::::::::::::::
CCDS97 MFSPGQEEHCAPNKEPVKYGELVVLGYNGALPNGDRGRRKSRFALYKRPKANGVKPSTVH
10 20 30 40 50 60
60 70 80 90 100 110
pF1KE3 IACTPQAAKAISNKDQHSISYTLSRAQTVVVEYTHDSNTDMFQIGRSTESPIDFVVTDTV
. ::::.:::: : :::::::::: ::::::::::..:::::.:::::::::::::::.
CCDS97 VISTPQASKAISCKGQHSISYTLSRNQTVVVEYTHDKDTDMFQVGRSTESPIDFVVTDTI
70 80 90 100 110 120
120 130 140 150 160 170
pF1KE3 PGSQSNSDTQSVQSTISRFACRIICERNPPFTARIYAAGFDSSKNIFLGEKAAKWKTSDG
:::.....: .:::::::::::.:.:: :.::::.::::::::::::::::::::. ::
CCDS97 SGSQNTDEAQITQSTISRFACRIVCDRNEPYTARIFAAGFDSSKNIFLGEKAAKWKNPDG
130 140 150 160 170 180
180 190 200 210 220 230
pF1KE3 QMDGLTTNGVLVMHPRNGFTEDSKPGIWREISVCGNVFSLRETRSAQQRGKMVEIETNQL
.:::::::::::::::.::::.:.::.::::::::.:..::::::::::::.:: ::: :
CCDS97 HMDGLTTNGVLVMHPRGGFTEESQPGVWREISVCGDVYTLRETRSAQQRGKLVESETNVL
190 200 210 220 230 240
240 250 260 270 280 290
pF1KE3 QDGSLIDLCGATLLWRTAEGLSHTPTVKHLEALRQEINAARPQCPVGFNTLAFPSMKRKD
::::::::::::::::::.:: :::: ::.:::::::::::::::::.:::::::..::.
CCDS97 QDGSLIDLCGATLLWRTADGLFHTPTQKHIEALRQEINAARPQCPVGLNTLAFPSINRKE
250 260 270 280 290 300
300 310 320 330 340 350
pF1KE3 VVDEKQPWVYLNCGHVHGYHNWGNKEERDGKDRECPMCRSVGPYVPLWLGCEAGFYVDAG
::.:::::.::.:::::::::::.. . ....:::::::.::::::::::::::::::::
CCDS97 VVEEKQPWAYLSCGHVHGYHNWGHRSDTEANERECPMCRTVGPYVPLWLGCEAGFYVDAG
310 320 330 340 350 360
360 370 380 390 400 410
pF1KE3 PPTHAFSPCGHVCSEKTTAYWSQIPLPHGTHTFHAACPFCAHQLAGEQGYIRLIFQGPLD
::::::.:::::::::.. ::::::::::::.::::::::: ::.:::. :.::::::.:
CCDS97 PPTHAFTPCGHVCSEKSAKYWSQIPLPHGTHAFHAACPFCATQLVGEQNCIKLIFQGPID
370 380 390 400 410 420
>>CCDS41675.1 PELI3 gene_id:246330|Hs108|chr11 (445 aa)
initn: 1061 init1: 1061 opt: 2138 Z-score: 2444.7 bits: 461.4 E(32554): 7.5e-130
Smith-Waterman score: 2138; 70.5% identity (88.5% similar) in 417 aa overlap (3-418:30-445)
10 20 30
pF1KE3 MFSPDQENHPSKAPVKYGELIVLGYNGSLPNGD
:: .. .:.. :.:::::::::::: : .::
CCDS41 MVLEGNPEVGSPRTSDLQHRGNKGSCVLSSPGEDAQPGEEPIKYGELIVLGYNGCLASGD
10 20 30 40 50 60
40 50 60 70 80 90
pF1KE3 RGRRKSRFALFKRPKANGVKPSTVHIACTPQAAKAISNKDQHSISYTLSRAQTVVVEYTH
.:::.::.:: .: .::::::...: :: ..::.::. ::::::::::...:.:::::
CCDS41 KGRRRSRLALSRRSHANGVKPDVMHHISTPLVSKALSNRGQHSISYTLSRSHSVIVEYTH
70 80 90 100 110 120
100 110 120 130 140 150
pF1KE3 DSNTDMFQIGRSTESPIDFVVTDTVPGSQSNSDTQSVQSTISRFACRIICERNPPFTARI
::.:::::::::::. :::::::: ::. . .. :.::::::.::::.:.: ::.::::
CCDS41 DSDTDMFQIGRSTENMIDFVVTDTSPGG-GAAEGPSAQSTISRYACRILCDRRPPYTARI
130 140 150 160 170
160 170 180 190 200 210
pF1KE3 YAAGFDSSKNIFLGEKAAKWKTSDGQMDGLTTNGVLVMHPRNGFTEDSKPGIWREISVCG
::::::.:.::::::.::::.: :: :::::::::::::: .::.::: ::.::::::::
CCDS41 YAAGFDASSNIFLGERAAKWRTPDGLMDGLTTNGVLVMHPAGGFSEDSAPGVWREISVCG
180 190 200 210 220 230
220 230 240 250 260 270
pF1KE3 NVFSLRETRSAQQRGKMVEIETNQLQDGSLIDLCGATLLWRTAEGLSHTPTVKHLEALRQ
::..::..::::::::.:: :.: :::::::::::::::::: :: ..::.:.::: ::
CCDS41 NVYTLRDSRSAQQRGKLVENESNVLQDGSLIDLCGATLLWRTPAGLLRAPTLKQLEAQRQ
240 250 260 270 280 290
280 290 300 310 320 330
pF1KE3 EINAARPQCPVGFNTLAFPSMKR-KDVVDEKQPWVYLNCGHVHGYHNWGNKEERDGKDRE
: ::::::::::..:::::: : . . :..:::::. ::::::::.:: ..:: ..::
CCDS41 EANAARPQCPVGLSTLAFPSPARGRTAPDKQQPWVYVRCGHVHGYHGWGCRRERGPQERE
300 310 320 330 340 350
340 350 360 370 380 390
pF1KE3 CPMCRSVGPYVPLWLGCEAGFYVDAGPPTHAFSPCGHVCSEKTTAYWSQIPLPHGTHTFH
::.:: :::::::::: :::. .: :::.:::.::::::::::. ::.: :::::::.::
CCDS41 CPLCRLVGPYVPLWLGQEAGLCLDPGPPSHAFAPCGHVCSEKTARYWAQTPLPHGTHAFH
360 370 380 390 400 410
400 410
pF1KE3 AACPFCAHQLAGEQGYIRLIFQGPLD
::::::. :.::.: .:::::::::
CCDS41 AACPFCGAWLTGEHGCVRLIFQGPLD
420 430 440
>>CCDS31615.1 PELI3 gene_id:246330|Hs108|chr11 (469 aa)
initn: 1047 init1: 963 opt: 2040 Z-score: 2332.4 bits: 440.7 E(32554): 1.4e-123
Smith-Waterman score: 2080; 66.7% identity (83.7% similar) in 441 aa overlap (3-418:30-469)
10 20
pF1KE3 MFSPDQENHPSKAPVKYGELIVLG---------
:: .. .:.. :.:::::::::
CCDS31 MVLEGNPEVGSPRTSDLQHRGNKGSCVLSSPGEDAQPGEEPIKYGELIVLGCCEEGGEET
10 20 30 40 50 60
30 40 50 60
pF1KE3 ---------------YNGSLPNGDRGRRKSRFALFKRPKANGVKPSTVHIACTPQAAKAI
::: : .::.:::.::.:: .: .::::::...: :: ..::.
CCDS31 EAQRGEVTGPRAHSCYNGCLASGDKGRRRSRLALSRRSHANGVKPDVMHHISTPLVSKAL
70 80 90 100 110 120
70 80 90 100 110 120
pF1KE3 SNKDQHSISYTLSRAQTVVVEYTHDSNTDMFQIGRSTESPIDFVVTDTVPGSQSNSDTQS
::. ::::::::::...:.:::::::.:::::::::::. :::::::: ::. . .. :
CCDS31 SNRGQHSISYTLSRSHSVIVEYTHDSDTDMFQIGRSTENMIDFVVTDTSPGG-GAAEGPS
130 140 150 160 170
130 140 150 160 170 180
pF1KE3 VQSTISRFACRIICERNPPFTARIYAAGFDSSKNIFLGEKAAKWKTSDGQMDGLTTNGVL
.::::::.::::.:.: ::.::::::::::.:.::::::.::::.: :: ::::::::::
CCDS31 AQSTISRYACRILCDRRPPYTARIYAAGFDASSNIFLGERAAKWRTPDGLMDGLTTNGVL
180 190 200 210 220 230
190 200 210 220 230 240
pF1KE3 VMHPRNGFTEDSKPGIWREISVCGNVFSLRETRSAQQRGKMVEIETNQLQDGSLIDLCGA
:::: .::.::: ::.::::::::::..::..::::::::.:: :.: ::::::::::::
CCDS31 VMHPAGGFSEDSAPGVWREISVCGNVYTLRDSRSAQQRGKLVENESNVLQDGSLIDLCGA
240 250 260 270 280 290
250 260 270 280 290 300
pF1KE3 TLLWRTAEGLSHTPTVKHLEALRQEINAARPQCPVGFNTLAFPSMKR-KDVVDEKQPWVY
:::::: :: ..::.:.::: ::: ::::::::::..:::::: : . . :..:::::
CCDS31 TLLWRTPAGLLRAPTLKQLEAQRQEANAARPQCPVGLSTLAFPSPARGRTAPDKQQPWVY
300 310 320 330 340 350
310 320 330 340 350 360
pF1KE3 LNCGHVHGYHNWGNKEERDGKDRECPMCRSVGPYVPLWLGCEAGFYVDAGPPTHAFSPCG
. ::::::::.:: ..:: ..::::.:: :::::::::: :::. .: :::.:::.:::
CCDS31 VRCGHVHGYHGWGCRRERGPQERECPLCRLVGPYVPLWLGQEAGLCLDPGPPSHAFAPCG
360 370 380 390 400 410
370 380 390 400 410
pF1KE3 HVCSEKTTAYWSQIPLPHGTHTFHAACPFCAHQLAGEQGYIRLIFQGPLD
:::::::. ::.: :::::::.::::::::. :.::.: .:::::::::
CCDS31 HVCSEKTARYWAQTPLPHGTHAFHAACPFCGAWLTGEHGCVRLIFQGPLD
420 430 440 450 460
>>CCDS73328.1 PELI3 gene_id:246330|Hs108|chr11 (406 aa)
initn: 1014 init1: 926 opt: 1894 Z-score: 2166.5 bits: 409.8 E(32554): 2.4e-114
Smith-Waterman score: 1894; 72.6% identity (89.4% similar) in 358 aa overlap (62-418:50-406)
40 50 60 70 80 90
pF1KE3 GDRGRRKSRFALFKRPKANGVKPSTVHIACTPQAAKAISNKDQHSISYTLSRAQTVVVEY
:: ..::.::. ::::::::::...:.:::
CCDS73 RGNKGSCVLSSPGEDAQPGEEPIKYGELISTPLVSKALSNRGQHSISYTLSRSHSVIVEY
20 30 40 50 60 70
100 110 120 130 140 150
pF1KE3 THDSNTDMFQIGRSTESPIDFVVTDTVPGSQSNSDTQSVQSTISRFACRIICERNPPFTA
::::.:::::::::::. :::::::: ::. . .. :.::::::.::::.:.: ::.::
CCDS73 THDSDTDMFQIGRSTENMIDFVVTDTSPGG-GAAEGPSAQSTISRYACRILCDRRPPYTA
80 90 100 110 120 130
160 170 180 190 200 210
pF1KE3 RIYAAGFDSSKNIFLGEKAAKWKTSDGQMDGLTTNGVLVMHPRNGFTEDSKPGIWREISV
::::::::.:.::::::.::::.: :: :::::::::::::: .::.::: ::.::::::
CCDS73 RIYAAGFDASSNIFLGERAAKWRTPDGLMDGLTTNGVLVMHPAGGFSEDSAPGVWREISV
140 150 160 170 180 190
220 230 240 250 260 270
pF1KE3 CGNVFSLRETRSAQQRGKMVEIETNQLQDGSLIDLCGATLLWRTAEGLSHTPTVKHLEAL
::::..::..::::::::.:: :.: :::::::::::::::::: :: ..::.:.:::
CCDS73 CGNVYTLRDSRSAQQRGKLVENESNVLQDGSLIDLCGATLLWRTPAGLLRAPTLKQLEAQ
200 210 220 230 240 250
280 290 300 310 320 330
pF1KE3 RQEINAARPQCPVGFNTLAFPSMKR-KDVVDEKQPWVYLNCGHVHGYHNWGNKEERDGKD
::: ::::::::::..:::::: : . . :..:::::. ::::::::.:: ..:: ..
CCDS73 RQEANAARPQCPVGLSTLAFPSPARGRTAPDKQQPWVYVRCGHVHGYHGWGCRRERGPQE
260 270 280 290 300 310
340 350 360 370 380 390
pF1KE3 RECPMCRSVGPYVPLWLGCEAGFYVDAGPPTHAFSPCGHVCSEKTTAYWSQIPLPHGTHT
::::.:: :::::::::: :::. .: :::.:::.::::::::::. ::.: :::::::.
CCDS73 RECPLCRLVGPYVPLWLGQEAGLCLDPGPPSHAFAPCGHVCSEKTARYWAQTPLPHGTHA
320 330 340 350 360 370
400 410
pF1KE3 FHAACPFCAHQLAGEQGYIRLIFQGPLD
::::::::. :.::.: .:::::::::
CCDS73 FHAACPFCGAWLTGEHGCVRLIFQGPLD
380 390 400
418 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Sun Nov 6 01:58:26 2016 done: Sun Nov 6 01:58:26 2016
Total Scan time: 2.780 Total Display time: 0.020
Function used was FASTA [36.3.4 Apr, 2011]