FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE3348, 1032 aa
1>>>pF1KE3348 1032 - 1032 aa - 1032 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 6.3028+/-0.00114; mu= 16.6592+/- 0.068
mean_var=117.7502+/-24.596, 0's: 0 Z-trim(105.7): 135 B-trim: 68 in 1/49
Lambda= 0.118193
statistics sampled from 8427 (8591) to 8427 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.62), E-opt: 0.2 (0.264), width: 16
Scan time: 2.720
The best scores are: opt bits E(32554)
CCDS2848.1 TLR9 gene_id:54106|Hs108|chr3 (1032) 7049 1214.5 0
CCDS14152.1 TLR8 gene_id:51311|Hs108|chrX (1041) 1934 342.3 3.3e-93
CCDS14153.1 TLR8 gene_id:51311|Hs108|chrX (1059) 1934 342.3 3.3e-93
CCDS14151.1 TLR7 gene_id:51284|Hs108|chrX (1049) 1241 224.1 1.2e-57
CCDS31033.1 TLR5 gene_id:7100|Hs108|chr1 ( 858) 519 100.9 1.2e-20
CCDS33973.1 TLR1 gene_id:7096|Hs108|chr4 ( 786) 369 75.3 5.7e-13
>>CCDS2848.1 TLR9 gene_id:54106|Hs108|chr3 (1032 aa)
initn: 7049 init1: 7049 opt: 7049 Z-score: 6500.7 bits: 1214.5 E(32554): 0
Smith-Waterman score: 7049; 100.0% identity (100.0% similar) in 1032 aa overlap (1-1032:1-1032)
10 20 30 40 50 60
pF1KE3 MGFCRSALHPLSLLVQAIMLAMTLALGTLPAFLPCELQPHGLVNCNWLFLKSVPHFSMAA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS28 MGFCRSALHPLSLLVQAIMLAMTLALGTLPAFLPCELQPHGLVNCNWLFLKSVPHFSMAA
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE3 PRGNVTSLSLSSNRIHHLHDSDFAHLPSLRHLNLKWNCPPVGLSPMHFPCHMTIEPSTFL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS28 PRGNVTSLSLSSNRIHHLHDSDFAHLPSLRHLNLKWNCPPVGLSPMHFPCHMTIEPSTFL
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE3 AVPTLEELNLSYNNIMTVPALPKSLISLSLSHTNILMLDSASLAGLHALRFLFMDGNCYY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS28 AVPTLEELNLSYNNIMTVPALPKSLISLSLSHTNILMLDSASLAGLHALRFLFMDGNCYY
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE3 KNPCRQALEVAPGALLGLGNLTHLSLKYNNLTVVPRNLPSSLEYLLLSYNRIVKLAPEDL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS28 KNPCRQALEVAPGALLGLGNLTHLSLKYNNLTVVPRNLPSSLEYLLLSYNRIVKLAPEDL
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE3 ANLTALRVLDVGGNCRRCDHAPNPCMECPRHFPQLHPDTFSHLSRLEGLVLKDSSLSWLN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS28 ANLTALRVLDVGGNCRRCDHAPNPCMECPRHFPQLHPDTFSHLSRLEGLVLKDSSLSWLN
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE3 ASWFRGLGNLRVLDLSENFLYKCITKTKAFQGLTQLRKLNLSFNYQKRVSFAHLSLAPSF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS28 ASWFRGLGNLRVLDLSENFLYKCITKTKAFQGLTQLRKLNLSFNYQKRVSFAHLSLAPSF
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE3 GSLVALKELDMHGIFFRSLDETTLRPLARLPMLQTLRLQMNFINQAQLGIFRAFPGLRYV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS28 GSLVALKELDMHGIFFRSLDETTLRPLARLPMLQTLRLQMNFINQAQLGIFRAFPGLRYV
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE3 DLSDNRISGASELTATMGEADGGEKVWLQPGDLAPAPVDTPSSEDFRPNCSTLNFTLDLS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS28 DLSDNRISGASELTATMGEADGGEKVWLQPGDLAPAPVDTPSSEDFRPNCSTLNFTLDLS
430 440 450 460 470 480
490 500 510 520 530 540
pF1KE3 RNNLVTVQPEMFAQLSHLQCLRLSHNCISQAVNGSQFLPLTGLQVLDLSHNKLDLYHEHS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS28 RNNLVTVQPEMFAQLSHLQCLRLSHNCISQAVNGSQFLPLTGLQVLDLSHNKLDLYHEHS
490 500 510 520 530 540
550 560 570 580 590 600
pF1KE3 FTELPRLEALDLSYNSQPFGMQGVGHNFSFVAHLRTLRHLSLAHNNIHSQVSQQLCSTSL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS28 FTELPRLEALDLSYNSQPFGMQGVGHNFSFVAHLRTLRHLSLAHNNIHSQVSQQLCSTSL
550 560 570 580 590 600
610 620 630 640 650 660
pF1KE3 RALDFSGNALGHMWAEGDLYLHFFQGLSGLIWLDLSQNRLHTLLPQTLRNLPKSLQVLRL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS28 RALDFSGNALGHMWAEGDLYLHFFQGLSGLIWLDLSQNRLHTLLPQTLRNLPKSLQVLRL
610 620 630 640 650 660
670 680 690 700 710 720
pF1KE3 RDNYLAFFKWWSLHFLPKLEVLDLAGNQLKALTNGSLPAGTRLRRLDVSCNSISFVAPGF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS28 RDNYLAFFKWWSLHFLPKLEVLDLAGNQLKALTNGSLPAGTRLRRLDVSCNSISFVAPGF
670 680 690 700 710 720
730 740 750 760 770 780
pF1KE3 FSKAKELRELNLSANALKTVDHSWFGPLASALQILDVSANPLHCACGAAFMDFLLEVQAA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS28 FSKAKELRELNLSANALKTVDHSWFGPLASALQILDVSANPLHCACGAAFMDFLLEVQAA
730 740 750 760 770 780
790 800 810 820 830 840
pF1KE3 VPGLPSRVKCGSPGQLQGLSIFAQDLRLCLDEALSWDCFALSLLAVALGLGVPMLHHLCG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS28 VPGLPSRVKCGSPGQLQGLSIFAQDLRLCLDEALSWDCFALSLLAVALGLGVPMLHHLCG
790 800 810 820 830 840
850 860 870 880 890 900
pF1KE3 WDLWYCFHLCLAWLPWRGRQSGRDEDALPYDAFVVFDKTQSAVADWVYNELRGQLEECRG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS28 WDLWYCFHLCLAWLPWRGRQSGRDEDALPYDAFVVFDKTQSAVADWVYNELRGQLEECRG
850 860 870 880 890 900
910 920 930 940 950 960
pF1KE3 RWALRLCLEERDWLPGKTLFENLWASVYGSRKTLFVLAHTDRVSGLLRASFLLAQQRLLE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS28 RWALRLCLEERDWLPGKTLFENLWASVYGSRKTLFVLAHTDRVSGLLRASFLLAQQRLLE
910 920 930 940 950 960
970 980 990 1000 1010 1020
pF1KE3 DRKDVVVLVILSPDGRRSRYVRLRQRLCRQSVLLWPHQPSGQRSFWAQLGMALTRDNHHF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS28 DRKDVVVLVILSPDGRRSRYVRLRQRLCRQSVLLWPHQPSGQRSFWAQLGMALTRDNHHF
970 980 990 1000 1010 1020
1030
pF1KE3 YNRNFCQGPTAE
::::::::::::
CCDS28 YNRNFCQGPTAE
1030
>>CCDS14152.1 TLR8 gene_id:51311|Hs108|chrX (1041 aa)
initn: 1415 init1: 348 opt: 1934 Z-score: 1787.0 bits: 342.3 E(32554): 3.3e-93
Smith-Waterman score: 1985; 35.6% identity (66.5% similar) in 1016 aa overlap (34-1025:35-1034)
10 20 30 40 50 60
pF1KE3 CRSALHPLSLLVQAIMLAMTLALGTLPAFLPCELQPHG---LVNCNWLFLKSVPHFSMAA
::. . .. ...:. :. ::.
CCDS14 FLQSSMLTCIFLLISGSCELCAEENFSRSYPCDEKKQNDSVIAECSNRRLQEVPQTV---
10 20 30 40 50 60
70 80 90 100 110
pF1KE3 PRGN-VTSLSLSSNRIHHLHDSDFAHLPSLRHLNLKWNCPPV---GLSPMHFPCHMTIEP
:. :: :.::.: : :. . .: : .: ..::. : : : . .: ..:
CCDS14 --GKYVTELDLSDNFITHITNESFQGLQNLTKINLNHN-PNVQHQNGNPGIQSNGLNITD
70 80 90 100 110
120 130 140 150 160 170
pF1KE3 STFLAVPTLEELNLSYNNIMTVPA-LPKSLISLSLSHTNILMLDSASLAGLHALRFLFMD
..:: . .:.:: : :.. .:. ::.:: ::: ..:: . . ... : :. :..
CCDS14 GAFLNLKNLRELLLEDNQLPQIPSGLPESLTELSLIQNNIYNITKEGISRLINLKNLYLA
120 130 140 150 160 170
180 190 200 210 220 230
pF1KE3 GNCYYKNPCRQALEVAPGALLGLGNLTHLSLKYNNLTVVPRNLPSSLEYLLLSYNRIVKL
:::... :... .. :.. : :: :::..:.:. :: .:::::. :.:: ..: .
CCDS14 WNCYFNKVCEKT-NIEDGVFETLTNLELLSLSFNSLSHVPPKLPSSLRKLFLSNTQIKYI
180 190 200 210 220 230
240 250 260 270 280 290
pF1KE3 APEDLANLTALRVLDVGGNCRRCDHAPNPCMECPRHFPQLHPDTFS--HLSRLEGLVLKD
. ::. .: : .::..::: :: .:: ::. : ... : :. .:..:. : :..
CCDS14 SEEDFKGLINLTLLDLSGNCPRCFNAPFPCVPCDGG-ASINIDRFAFQNLTQLRYLNLSS
240 250 260 270 280 290
300 310 320 330 340 350
pF1KE3 SSLSWLNASWFRGLGNLRVLDLSENFLYKCITKTKAFQGLTQLRKLNLSFNYQKRVSFAH
.:: .::.::... .:.:::: :.: :.. . : .:. :.::::: : :
CCDS14 TSLRKINAAWFKNMPHLKVLDLEFNYLVGEIASGAFLTMLPRLEILDLSFNYIKGSYPQH
300 310 320 330 340 350
360 370 380 390 400 410
pF1KE3 LSLAPSFGSLVALKELDMHGIFFRSLDETTLRPLARLPMLQTLRLQMNFINQAQLGIFRA
.... .:..:..:. : ..: :. : : ..:: .:: :.:. : .:::.: .. .:.
CCDS14 INISRNFSKLLSLRALHLRGYVFQELREDDFQPLMQLPNLSTINLGINFIKQIDFKLFQN
360 370 380 390 400 410
420 430 440 450 460
pF1KE3 FPGLRYVDLSDNRISGASELTATMGEADGGEKVWLQPGDLAPAPVDTPSSEDF-------
: .:. . ::.:::: . : ... . .. . : : :. .
CCDS14 FSNLEIIYLSENRISPLVKDTRQSYANSSSFQRHIRKRRSTDFEFD-PHSNFYHFTRPLI
420 430 440 450 460 470
470 480 490 500 510 520
pF1KE3 RPNCSTLNFTLDLSRNNLVTVQPEMFAQLSHLQCLRLSHNCISQAVNGSQFLPLTGLQVL
.:.:.. . .:::: :.. . :..: .: . :: :: : .:...:..: . .. :
CCDS14 KPQCAAYGKALDLSLNSIFFIGPNQFENLPDIACLNLSANSNAQVLSGTEFSAIPHVKYL
480 490 500 510 520 530
530 540 550 560 570 580
pF1KE3 DLSHNKLDLYHEHSFTELPRLEALDLSYNSQPFGMQGVGHNFSFVAHLRTLRHLSLAHNN
::..:.::. . ..::: ::.:::::::. : . :: :.. :. .. .:. :.:.:::
CCDS14 DLTNNRLDFDNASALTELSDLEVLDLSYNSHYFRIAGVTHHLEFIQNFTNLKVLNLSHNN
540 550 560 570 580 590
590 600 610 620 630 640
pF1KE3 IHSQVSQ-QLCSTSLRALDFSGNALGHMWAEGD-LYLHFFQGLSGLIWLDLSQNRLHTLL
:.. ... .: : :: : :::: : .: . : :. .:.::..: :::: :::. .
CCDS14 IYTLTDKYNLESKSLVELVFSGNRLDILWNDDDNRYISIFKGLKNLTRLDLSLNRLKHIP
600 610 620 630 640 650
650 660 670 680 690 700
pF1KE3 PQTLRNLPKSLQVLRLRDNYLAFFKWWSLHFLPKLEVLDLAGNQLKALTNGSLPAGTRLR
... ::: :: :.. ::.: ::.: :. .:.::.::: ::.: ::.. . ::
CCDS14 NEAFLNLPASLTELHINDNMLKFFNWTLLQQFPRLELLDLRGNKLLFLTDSLSDFTSSLR
660 670 680 690 700 710
710 720 730 740 750 760
pF1KE3 RLDVSCNSISFVAPGFFSKAKELRELNLSANALKTVDHSWF-GPLASALQILDVSANPLH
: .: : :: . ::.:... :..:.::.: :::...: . .. :..:.. .::..
CCDS14 TLLLSHNRISHLPSGFLSEVSSLKHLDLSSNLLKTINKSALETKTTTKLSMLELHGNPFE
720 730 740 750 760 770
770 780 790 800 810
pF1KE3 CACGAA----FMDFLLEVQAAVPGLPSRVKCGSPGQLQGLSIFAQDLRLCLDEALSWDCF
:.: . .:: :.:. .: : . : :.:::. .: :: . .: :.... . :
CCDS14 CTCDIGDFRRWMDEHLNVK--IPRLVD-VICASPGDQRGKSIVSLELTTCVSDVTAVILF
780 790 800 810 820 830
820 830 840 850 860 870
pF1KE3 ALSLLAVALGLGVPMLHHLCGWDLWYCFHLCLAWLPWRGRQSGRDEDALPYDAFVVFDKT
.... ... . . . ::: ::.:. ...::: . .: .: ... :::.. .:
CCDS14 FFTFFITTMVMLAALAHHLFYWDVWFIYNVCLAKV--KGYRSLSTSQTF-YDAYISYDTK
840 850 860 870 880
880 890 900 910 920 930
pF1KE3 QSAVADWVYNELRGQLEECRGRWALRLCLEERDWLPGKTLFENLWASVYGSRKTLFVLAH
...:.::: :::: .::: : . .: :::::::: :: ....:: :. :.::.:::..
CCDS14 DASVTDWVINELRYHLEESRDKNVL-LCLEERDWDPGLAIIDNLMQSINQSKKTVFVLTK
890 900 910 920 930 940
940 950 960 970 980 990
pF1KE3 TDRVSGLLRASFLLAQQRLLEDRKDVVVLVILSPDGRRSRYVRLRQRLCRQSVLLWPHQP
: ....: :: :::... ::.....: : ..:.:.:::::.:..:.: :: .:
CCDS14 KYAKSWNFKTAFYLALQRLMDENMDVIIFILLEPVLQHSQYLRLRQRICKSSILQWPDNP
950 960 970 980 990 1000
1000 1010 1020 1030
pF1KE3 SGQRSFWAQLGMALTRDNHHFYNRNFCQGPTAE
... :: : .. .: :: .
CCDS14 KAEGLFWQTLRNVVLTENDSRYNNMYVDSIKQY
1010 1020 1030 1040
>>CCDS14153.1 TLR8 gene_id:51311|Hs108|chrX (1059 aa)
initn: 1415 init1: 348 opt: 1934 Z-score: 1786.9 bits: 342.3 E(32554): 3.3e-93
Smith-Waterman score: 1985; 35.6% identity (66.5% similar) in 1016 aa overlap (34-1025:53-1052)
10 20 30 40 50 60
pF1KE3 CRSALHPLSLLVQAIMLAMTLALGTLPAFLPCELQPHG---LVNCNWLFLKSVPHFSMAA
::. . .. ...:. :. ::.
CCDS14 FLQSSMLTCIFLLISGSCELCAEENFSRSYPCDEKKQNDSVIAECSNRRLQEVPQTV---
30 40 50 60 70
70 80 90 100 110
pF1KE3 PRGN-VTSLSLSSNRIHHLHDSDFAHLPSLRHLNLKWNCPPV---GLSPMHFPCHMTIEP
:. :: :.::.: : :. . .: : .: ..::. : : : . .: ..:
CCDS14 --GKYVTELDLSDNFITHITNESFQGLQNLTKINLNHN-PNVQHQNGNPGIQSNGLNITD
80 90 100 110 120 130
120 130 140 150 160 170
pF1KE3 STFLAVPTLEELNLSYNNIMTVPA-LPKSLISLSLSHTNILMLDSASLAGLHALRFLFMD
..:: . .:.:: : :.. .:. ::.:: ::: ..:: . . ... : :. :..
CCDS14 GAFLNLKNLRELLLEDNQLPQIPSGLPESLTELSLIQNNIYNITKEGISRLINLKNLYLA
140 150 160 170 180 190
180 190 200 210 220 230
pF1KE3 GNCYYKNPCRQALEVAPGALLGLGNLTHLSLKYNNLTVVPRNLPSSLEYLLLSYNRIVKL
:::... :... .. :.. : :: :::..:.:. :: .:::::. :.:: ..: .
CCDS14 WNCYFNKVCEKT-NIEDGVFETLTNLELLSLSFNSLSHVPPKLPSSLRKLFLSNTQIKYI
200 210 220 230 240 250
240 250 260 270 280 290
pF1KE3 APEDLANLTALRVLDVGGNCRRCDHAPNPCMECPRHFPQLHPDTFS--HLSRLEGLVLKD
. ::. .: : .::..::: :: .:: ::. : ... : :. .:..:. : :..
CCDS14 SEEDFKGLINLTLLDLSGNCPRCFNAPFPCVPCDGG-ASINIDRFAFQNLTQLRYLNLSS
260 270 280 290 300 310
300 310 320 330 340 350
pF1KE3 SSLSWLNASWFRGLGNLRVLDLSENFLYKCITKTKAFQGLTQLRKLNLSFNYQKRVSFAH
.:: .::.::... .:.:::: :.: :.. . : .:. :.::::: : :
CCDS14 TSLRKINAAWFKNMPHLKVLDLEFNYLVGEIASGAFLTMLPRLEILDLSFNYIKGSYPQH
320 330 340 350 360 370
360 370 380 390 400 410
pF1KE3 LSLAPSFGSLVALKELDMHGIFFRSLDETTLRPLARLPMLQTLRLQMNFINQAQLGIFRA
.... .:..:..:. : ..: :. : : ..:: .:: :.:. : .:::.: .. .:.
CCDS14 INISRNFSKLLSLRALHLRGYVFQELREDDFQPLMQLPNLSTINLGINFIKQIDFKLFQN
380 390 400 410 420 430
420 430 440 450 460
pF1KE3 FPGLRYVDLSDNRISGASELTATMGEADGGEKVWLQPGDLAPAPVDTPSSEDF-------
: .:. . ::.:::: . : ... . .. . : : :. .
CCDS14 FSNLEIIYLSENRISPLVKDTRQSYANSSSFQRHIRKRRSTDFEFD-PHSNFYHFTRPLI
440 450 460 470 480 490
470 480 490 500 510 520
pF1KE3 RPNCSTLNFTLDLSRNNLVTVQPEMFAQLSHLQCLRLSHNCISQAVNGSQFLPLTGLQVL
.:.:.. . .:::: :.. . :..: .: . :: :: : .:...:..: . .. :
CCDS14 KPQCAAYGKALDLSLNSIFFIGPNQFENLPDIACLNLSANSNAQVLSGTEFSAIPHVKYL
500 510 520 530 540 550
530 540 550 560 570 580
pF1KE3 DLSHNKLDLYHEHSFTELPRLEALDLSYNSQPFGMQGVGHNFSFVAHLRTLRHLSLAHNN
::..:.::. . ..::: ::.:::::::. : . :: :.. :. .. .:. :.:.:::
CCDS14 DLTNNRLDFDNASALTELSDLEVLDLSYNSHYFRIAGVTHHLEFIQNFTNLKVLNLSHNN
560 570 580 590 600 610
590 600 610 620 630 640
pF1KE3 IHSQVSQ-QLCSTSLRALDFSGNALGHMWAEGD-LYLHFFQGLSGLIWLDLSQNRLHTLL
:.. ... .: : :: : :::: : .: . : :. .:.::..: :::: :::. .
CCDS14 IYTLTDKYNLESKSLVELVFSGNRLDILWNDDDNRYISIFKGLKNLTRLDLSLNRLKHIP
620 630 640 650 660 670
650 660 670 680 690 700
pF1KE3 PQTLRNLPKSLQVLRLRDNYLAFFKWWSLHFLPKLEVLDLAGNQLKALTNGSLPAGTRLR
... ::: :: :.. ::.: ::.: :. .:.::.::: ::.: ::.. . ::
CCDS14 NEAFLNLPASLTELHINDNMLKFFNWTLLQQFPRLELLDLRGNKLLFLTDSLSDFTSSLR
680 690 700 710 720 730
710 720 730 740 750 760
pF1KE3 RLDVSCNSISFVAPGFFSKAKELRELNLSANALKTVDHSWF-GPLASALQILDVSANPLH
: .: : :: . ::.:... :..:.::.: :::...: . .. :..:.. .::..
CCDS14 TLLLSHNRISHLPSGFLSEVSSLKHLDLSSNLLKTINKSALETKTTTKLSMLELHGNPFE
740 750 760 770 780 790
770 780 790 800 810
pF1KE3 CACGAA----FMDFLLEVQAAVPGLPSRVKCGSPGQLQGLSIFAQDLRLCLDEALSWDCF
:.: . .:: :.:. .: : . : :.:::. .: :: . .: :.... . :
CCDS14 CTCDIGDFRRWMDEHLNVK--IPRLVD-VICASPGDQRGKSIVSLELTTCVSDVTAVILF
800 810 820 830 840 850
820 830 840 850 860 870
pF1KE3 ALSLLAVALGLGVPMLHHLCGWDLWYCFHLCLAWLPWRGRQSGRDEDALPYDAFVVFDKT
.... ... . . . ::: ::.:. ...::: . .: .: ... :::.. .:
CCDS14 FFTFFITTMVMLAALAHHLFYWDVWFIYNVCLAKV--KGYRSLSTSQTF-YDAYISYDTK
860 870 880 890 900
880 890 900 910 920 930
pF1KE3 QSAVADWVYNELRGQLEECRGRWALRLCLEERDWLPGKTLFENLWASVYGSRKTLFVLAH
...:.::: :::: .::: : . .: :::::::: :: ....:: :. :.::.:::..
CCDS14 DASVTDWVINELRYHLEESRDKNVL-LCLEERDWDPGLAIIDNLMQSINQSKKTVFVLTK
910 920 930 940 950 960
940 950 960 970 980 990
pF1KE3 TDRVSGLLRASFLLAQQRLLEDRKDVVVLVILSPDGRRSRYVRLRQRLCRQSVLLWPHQP
: ....: :: :::... ::.....: : ..:.:.:::::.:..:.: :: .:
CCDS14 KYAKSWNFKTAFYLALQRLMDENMDVIIFILLEPVLQHSQYLRLRQRICKSSILQWPDNP
970 980 990 1000 1010 1020
1000 1010 1020 1030
pF1KE3 SGQRSFWAQLGMALTRDNHHFYNRNFCQGPTAE
... :: : .. .: :: .
CCDS14 KAEGLFWQTLRNVVLTENDSRYNNMYVDSIKQY
1030 1040 1050
>>CCDS14151.1 TLR7 gene_id:51284|Hs108|chrX (1049 aa)
initn: 1613 init1: 430 opt: 1241 Z-score: 1148.3 bits: 224.1 E(32554): 1.2e-57
Smith-Waterman score: 2028; 36.1% identity (64.6% similar) in 1043 aa overlap (13-1025:14-1045)
10 20 30 40 50
pF1KE3 MGFCRSALHPLSLLVQAIMLAMTLALGTLPAFLPCEL-----QPHGLVNCNWLFLKSVP
.: . :... :. .: :::.. . : .:.:. : .:
CCDS14 MVFPMWTLKRQILILFNIILISKLLGARWFPKTLPCDVTLDVPKNHVIVDCTDKHLTEIP
10 20 30 40 50 60
60 70 80 90 100 110
pF1KE3 HFSMAAPRGNVTSLSLSSNRIHHLHDSDFAHLPSLRHLNLKWNCPPVGLSPMHFPC--HM
. : :.:.:.:. :.: . ..: .: : ..... :: :. :. . : ..
CCDS14 G---GIPT-NTTNLTLTINHIPDISPASFHRLDHLVEIDFRCNCVPIPLGSKNNMCIKRL
70 80 90 100 110
120 130 140 150 160 170
pF1KE3 TIEPSTFLAVPTLEELNLSYNNIMTVP-ALPKSLISLSLSHTNILMLDSASLAGLHALRF
:.: .: .. :. : :. :... .: .:: :: ::: .::. . . .:. : ...
CCDS14 QIKPRSFSGLTYLKSLYLDGNQLLEIPQGLPPSLQLLSLEANNIFSIRKENLTELANIEI
120 130 140 150 160 170
180 190 200 210 220 230
pF1KE3 LFMDGNCYYKNPCRQALEVAPGALLGLGNLTHLSLKYNNLTVVPRNLPSSLEYLLLSYNR
:.. ::::.::: . . :.:.: .: :::: ::.:.:: :::.: : : :
CCDS14 LYLGQNCYYRNPCYVSYSIEKDAFLNLTKLKVLSLKDNNVTAVPTVLPSTLTELYLYNNM
180 190 200 210 220 230
240 250 260 270 280 290
pF1KE3 IVKLAPEDLANLTALRVLDVGGNCRRCDHAPNPCMECPRHFP-QLHPDTFSHLSRLEGLV
:.:. .:. ::. :..::..::: :: .:: :: : . : :. ..:. :..:. :
CCDS14 IAKIQEDDFNNLNQLQILDLSGNCPRCYNAPFPCAPCKNNSPLQIPVNAFDALTELKVLR
240 250 260 270 280 290
300 310 320 330 340 350
pF1KE3 LKDSSLSWLNASWFRGLGNLRVLDLSENFLYKCITKTKAFQGLTQLRKLNLSFNYQKRVS
:...::. . ::.....:. ::::.::: : : .: .. : .: .:.::::.. .:
CCDS14 LHSNSLQHVPPRWFKNINKLQELDLSQNFLAKEIGDAKFLHFLPSLIQLDLSFNFELQVY
300 310 320 330 340 350
360 370 380 390 400 410
pF1KE3 FAHLSLAPSFGSLVALKELDMHGIFFRSLDETTLRPLARLPMLQTLRLQMNFINQAQLGI
: ..:. .:.:: .:: : ..: :. : .: :: : :..: : :::. :.:..
CCDS14 RASMNLSQAFSSLKSLKILRIRGYVFKELKSFNLSPLHNLQNLEVLDLGTNFIKIANLSM
360 370 380 390 400 410
420 430 440 450 460
pF1KE3 FRAFPGLRYVDLSDNRISGASELTATMGEADGGEKVW-LQPGDLAPAPV---DTPS-SED
:. : :. .::: :.:: ... . . ... .: .: : : . :
CCDS14 FKQFKRLKVIDLSVNKISPSGDSSEVGFCSNARTSVESYEPQVLEQLHYFRYDKYARSCR
420 430 440 450 460 470
470 480 490 500 510
pF1KE3 FR----------PNCSTLNFTLDLSRNNLVTVQPEMFAQLSHLQCLRLSHNCISQAVNGS
:. .: . :::::.:.. :. : .:: :.:: :: : :::..:::
CCDS14 FKNKEASFMSVNESCYKYGQTLDLSKNSIFFVKSSDFQHLSFLKCLNLSGNLISQTLNGS
480 490 500 510 520 530
520 530 540 550 560 570
pF1KE3 QFLPLTGLQVLDLSHNKLDLYHEHSFTELPRLEALDLSYNSQPFGMQGVGHNFSFVAHLR
.: ::. :. ::.:.:.::: : .: :: .::.::.: ::. : .:. : ..:. .:.
CCDS14 EFQPLAELRYLDFSNNRLDLLHSTAFEELHKLEVLDISSNSHYFQSEGITHMLNFTKNLK
540 550 560 570 580 590
580 590 600 610 620 630
pF1KE3 TLRHLSLAHNNIHSQVSQQLCSTSLRALDFSGNALGHMWAEGD-LYLHFFQGLSGLIWLD
.:..: . :.: :..:. . : :::.:.: :: : .: ::: ::..:..: : ::
CCDS14 VLQKLMMNDNDISSSTSRTMESESLRTLEFRGNHLDVLWREGDNRYLQLFKNLLKLEELD
600 610 620 630 640 650
640 650 660 670 680 690
pF1KE3 LSQNRLHTLLPQTLRNLPKSLQVLRLRDNYLAFFKWWSLHFLPKLEVLDLAGNQLKALTN
.:.: : : .. ..: .:. : : : : :.: .:. : .::.:::. ::: .. .
CCDS14 ISKNSLSFLPSGVFDGMPPNLKNLSLAKNGLKSFSWKKLQCLKNLETLDLSHNQLTTVPE
660 670 680 690 700 710
700 710 720 730 740 750
pF1KE3 GSLPAGTRLRRLDVSCNSISFVAPGFFSKAKELRELNLSANALKTVDHSWFGP-LASALQ
. :. : .. :.: .. :.. : .:: :.::.: .. .... : . . :.
CCDS14 RLSNCSRSLKNLILKNNQIRSLTKYFLQDAFQLRYLDLSSNKIQMIQKTSFPENVLNNLK
720 730 740 750 760 770
760 770 780 790 800 810
pF1KE3 ILDVSANPLHCACGAA-FMDFLLEVQAAVPGLPSRVKCGSPGQLQGLSIFAQDLRLCLDE
.: . : . :.: :. :. .. ......: : . : : .:: .: :... :: : .
CCDS14 MLLLHHNRFLCTCDAVWFVWWVNHTEVTIPYLATDVTCVGPGAHKGQSVISLDLYTCELD
780 790 800 810 820 830
820 830 840 850 860 870
pF1KE3 ALSWDCFALSLLAVALGLGVPML-HHLCGWDLWYCFHLCLAWLPWRGRQSGRDEDALPYD
. :.::. .:.: : : : :: ::.:: .:.: : . .: : . : ::
CCDS14 LTNLILFSLSI-SVSLFLMVMMTASHLYFWDVWYIYHFCKAKI--KGYQRLISPDCC-YD
840 850 860 870 880 890
880 890 900 910 920 930
pF1KE3 AFVVFDKTQSAVADWVYNELRGQLEECRGRWALRLCLEERDWLPGKTLFENLWASVYGSR
::.:.: . ::..:: :: ..::. : . . :::::::::::. ..::: :. :.
CCDS14 AFIVYDTKDPAVTEWVLAELVAKLEDPREK-HFNLCLEERDWLPGQPVLENLSQSIQLSK
900 910 920 930 940 950
940 950 960 970 980
pF1KE3 KTLFVLAHTDRVSGL--LRASFLLAQQRLLEDRKDVVVLVILSPDGRRSRYVRLRQRLCR
::.::. ::. . .. .: :..:::.... ::..:..: ..:....::.:::
CCDS14 KTVFVM--TDKYAKTENFKIAFYLSHQRLMDEKVDVIILIFLEKPFQKSKFLQLRKRLCG
960 970 980 990 1000
990 1000 1010 1020 1030
pF1KE3 QSVLLWPHQPSGQRSFWAQLGMALTRDNHHFYNRNFCQGPTAE
.::: :: .:... :: : ::. ::: :.. :
CCDS14 SSVLEWPTNPQAHPYFWQCLKNALATDNHVAYSQVFKETV
1010 1020 1030 1040
>>CCDS31033.1 TLR5 gene_id:7100|Hs108|chr1 (858 aa)
initn: 316 init1: 129 opt: 519 Z-score: 484.1 bits: 100.9 E(32554): 1.2e-20
Smith-Waterman score: 624; 25.2% identity (55.8% similar) in 825 aa overlap (207-996:34-819)
180 190 200 210 220 230
pF1KE3 NCYYKNPCRQALEVAPGALLGLGNLTHLSLKYNNLTVVPRNLPSSLEYLLLSYNRIVKLA
.. ::: ::. : .. : ::::.: : ..
CCDS31 HLDLLLGVVLMAGPVFGIPSCSFDGRIAFYRFCNLTQVPQVLNTT-ERLLLSFNYIRTVT
10 20 30 40 50 60
240 250 260 270 280 290
pF1KE3 PEDLANLTALRVLDVGGNCRRCDHAPNPCMECPRHFPQLHPDTFSHLSRLEGLVLKDSSL
.. : :..:..:.. ..: . ..: .: :. : : .:..
CCDS31 ASSFPFLEQLQLLELGSQ-----YTPLT----------IDKEAFRNLPNLRILDLGSSKI
70 80 90 100
300 310 320 330 340 350
pF1KE3 SWLNASWFRGLGNLRVLDLSENFLYKCITKTKAFQGLTQLRKLNLSFNYQKRVSFAHLSL
.:. . :.:: .: : : : . : :..: : .:.:: : : : . :
CCDS31 YFLHPDAFQGLFHLFELRLYFCGLSDAVLKDGYFRNLKALTRLDLSKN-QIRSLYLH---
110 120 130 140 150 160
360 370 380 390 400 410
pF1KE3 APSFGSLVALKELDMHGIFFRSLDETTLRPLARLPMLQTLRLQMN-FINQAQLGIFRAFP
::::.: .:: .:. . . . : :.:: . :. . : : . ..... . .
CCDS31 -PSFGKLNSLKSIDFSSNQIFLVCEHELEPL-QGKTLSFFSLAANSLYSRVSVDWGKCMN
170 180 190 200 210 220
420 430 440 450 460
pF1KE3 GLRYVDLSDNRISGAS---ELTATMGEADGGEKVW-------LQPGDLAPAPVDTPSSED
.: . : .:: . ..:.....: . ... .. . .. . :...
CCDS31 PFRNMVLEILDVSGNGWTVDITGNFSNAISKSQAFSLILAHHIMGAGFGFHNIKDPDQNT
230 240 250 260 270 280
470 480 490 500 510 520
pF1KE3 FRPNCSTLNFTLDLSRNNLVTVQPEMFAQLSHLQCLRLSHNCISQAVNGSQFLPLTGLQV
: . ::::.. . ... ..: :. :. : :..: :.. . : : .:::
CCDS31 FAGLARSSVRHLDLSHGFVFSLNSRVFETLKDLKVLNLAYNKINK-IADEAFYGLDNLQV
290 300 310 320 330 340
530 540 550 560 570 580
pF1KE3 LDLSHNKLDLYHEHSFTELPRLEALDLSYNSQPFGMQGVGHNFSFVAHLRTLRHLSLAHN
:.::.: : . .: ::.. .::. : . .: ..:.:. .:.:: . : .
CCDS31 LNLSYNLLGELYSSNFYGLPKVAYIDLQKNHIAI-IQD--QTFKFLEKLQTLDLRDNALT
350 360 370 380 390
590 600 610 620 630
pF1KE3 NIH--SQVSQQLCS----TSLRALDFSGNALGHMWAEGDL----YLHFFQGLSGLIWLDL
.:: .. . . : ..: .....: : :. .:. : :.:. . : : :
CCDS31 TIHFIPSIPDIFLSGNKLVTLPKINLTAN-LIHL-SENRLENLDILYFLLRVPHLQILIL
400 410 420 430 440 450
640 650 660 670 680 690
pF1KE3 SQNRLHTLLPQTLRNLPKSLQVLRLRDNYLAF-----FKWWSLHFLPKLEVLDLAGNQLK
.:::. . . . ::. : : .:.: . . : .. : .:.:: : : :.
CCDS31 NQNRFSSCSGDQTPSENPSLEQLFLGENMLQLAWETELCWDVFEGLSHLQVLYLNHNYLN
460 470 480 490 500 510
700 710 720 730 740 750
pF1KE3 ALTNGSLPAGTRLRRLDVSCNSISFVAPGFFSKAKELRELNLSANALKTVDHSWFGPLAS
.: : . : :: :... : .. .. . . :. :..: : : . . . :
CCDS31 SLPPGVFSHLTALRGLSLNSNRLTVLSHNDLPANLEI--LDISRNQLLAPNPDVF----V
520 530 540 550 560
760 770 780 790 800
pF1KE3 ALQILDVSANPLHCACG-AAFMDFLLEVQAAVPGLPSRVKCGSPGQLQGLSIFAQDLRLC
.:..::.. : . : : ..:...: ...... : :. . : : ...:.:.:. . . :
CCDS31 SLSVLDITHNKFICECELSTFINWLNHTNVTIAGPPADIYCVYPDSFSGVSLFSLSTEGC
570 580 590 600 610 620
810 820 830 840 850 860
pF1KE3 LDEALSWDCFALSLLAV-ALGLGVPMLHHLCGWDLW-YCFHLCLAW---LPWRGRQSGRD
:: . .::. : .. : . .. : . .:: .: : .. . .: .
CCDS31 -DEEEVLKSLKFSLFIVCTVTLTLFLMTILTVTKFRGFCF-ICYKTAQRLVFKDHPQGTE
630 640 650 660 670 680
870 880 890 900 910 920
pF1KE3 EDALPYDAFVVFDKTQSAVADWVYNELRGQLE-ECRGRWALRLCLEERDWLPGKTLFENL
: :::.. :. : :: : : .:. . . . ::.::::..::.. . :.
CCDS31 PDMYKYDAYLCFS---SKDFTWVQNALLKHLDTQYSDQNRFNLCFEERDFVPGENRIANI
690 700 710 720 730 740
930 940 950 960 970 980
pF1KE3 WASVYGSRKTLFVLAHTDRVSGLLRASFLLAQQRLLEDRKDVVVLVILSPDGRRS--RYV
....::: . .... .: .: :: : : : ......:... .. . ..
CCDS31 QDAIWNSRKIVCLVSRHFLRDGWCLEAFSYAQGRCLSDLNSALIMVVVGSLSQYQLMKHQ
750 760 770 780 790 800
990 1000 1010 1020 1030
pF1KE3 RLRQRLCRQSVLLWPHQPSGQRSFWAQLGMALTRDNHHFYNRNFCQGPTAE
.: . .:. : ::
CCDS31 SIRGFVQKQQYLRWPEDLQDVGWFLHKLSQQILKKEKEKKKDNNIPLQTVATIS
810 820 830 840 850
>>CCDS33973.1 TLR1 gene_id:7096|Hs108|chr4 (786 aa)
initn: 233 init1: 106 opt: 369 Z-score: 346.4 bits: 75.3 E(32554): 5.7e-13
Smith-Waterman score: 447; 22.5% identity (57.3% similar) in 756 aa overlap (278-1013:64-776)
250 260 270 280 290 300
pF1KE3 VLDVGGNCRRCDHAPNPCMECPRHFPQLHPDTFSHLSRLEGLVLKDSSLSWLNASWFRGL
: .: ::.:. :... . ...:. : :.
CCDS33 NGLIHVPKDLSQKTTILNISQNYISELWTSDILS-LSKLRILIISHNRIQYLDISVFKFN
40 50 60 70 80 90
310 320 330 340 350 360
pF1KE3 GNLRVLDLSENFLYKCITKTKAFQGLTQLRKLNLSFNYQKRVSFAHLSLAPSFGSLVALK
.:. ::::.: : : . . ..:..:.:::: .: : . ::.. ::
CCDS33 QELEYLDLSHNKLVKI-----SCHPTVNLKHLDLSFN-----AFDALPICKEFGNMSQLK
100 110 120 130 140
370 380 390 400 410 420
pF1KE3 ELDMHGIFFRSLDETTLRPLARLPMLQTLR-LQMNFINQAQLGIFRAF--PGLRYVDLSD
: :. :..... :.:.: . ..: : .. .. . .. : .:. : ..
CCDS33 FL---GLSTTHLEKSSVLPIAHLNISKVLLVLGETYGEKEDPEGLQDFNTESLHIVFPTN
150 160 170 180 190
430 440 450 460 470 480
pF1KE3 NRISGASELTA-TMGEADGGEKVWLQPGDLAPAPVDTPSSEDFRPNCSTLNFT-LDLSRN
... .... :... . .. . . .. .. . :. :.:... .. . :
CCDS33 KEFHFILDVSVKTVANLELSNIKCVLEDNKCSYFLSILAKLQTNPKLSNLTLNNIETTWN
200 210 220 230 240 250
490 500 510 520 530 540
pF1KE3 NLVTVQPEMFAQLSHLQCLRLSHNCISQAVNGSQF-LPLTGLQVLDLSHNKLDLYHEHSF
... . ... . . . .:. .. .. .: :.:..:.. . :.. .:
CCDS33 SFIRIL--QLVWHTTVWYFSISNVKLQGQLDFRDFDYSGTSLKALSIHQVVSDVF---GF
260 270 280 290 300 310
550 560 570 580 590
pF1KE3 TELPRLEALDLSYNSQPFGMQGVGHNFSFV-AHLRTLRHLSLAHNNIHSQVSQQLCS--T
. : .. ..: . : ..:. . ... . ::... ::. ... . :. :
CCDS33 PQSYIYEIFS-NMNIKNFTVSGTRMVHMLCPSKISPFLHLDFS-NNLLTDTVFENCGHLT
320 330 340 350 360 370
600 610 620 630 640 650
pF1KE3 SLRALDFSGNALGHMWAEGDLYLHFFQGLSGLIWLDLSQNRLHTLLPQTLRNLPKSLQVL
:..: .. : : .. ... . ...: ::.::: . . . ::: :
CCDS33 ELETLILQMNQLKELSKIAEMTTQ----MKSLQQLDISQNSVSYDEKKGDCSWTKSLLSL
380 390 400 410 420
660 670 680 690 700 710
pF1KE3 RLRDNYLAFFKWWSLHFLPKLEVLDLAGNQLKALTNGSLPAGTRLRRLDVSCNSISFVAP
. .: :. . : :...:::: .:..:.. . . :..:.:. ::.. . :
CCDS33 NMSSNILTDTIFRCLP--PRIKVLDLHSNKIKSIPKQVVKL-EALQELNVAFNSLTDL-P
430 440 450 460 470 480
720 730 740 750 760 770
pF1KE3 GFFSKAKELRELNLSANALKTVDHSWFGPLASALQILDVSANPLHCACG-AAFMDFLLEV
: : .. : : .. :... . ..: . .. . .. ::..:.: . :. . .:
CCDS33 GCGSFSS-LSVLIIDHNSVSHPSADFFQS-CQKMRSIKAGDNPFQCTCELGEFVKNIDQV
490 500 510 520 530 540
780 790 800 810 820 830
pF1KE3 QAAV-PGLPSRVKCGSPGQLQGLSIFAQDLRLCLDEALSWDCFALSLLAVALGLGVPMLH
.. : : :. :: : . .: . .:... . . . . ....:. : :.: .
CCDS33 SSEVLEGWPDSYKCDYPESYRG--TLLKDFHMS-ELSCNITLLIVTIVATMLVLAVTVTS
550 560 570 580 590
840 850 860 870 880 890
pF1KE3 HLCGW-DL-WYCFHLCLAWLPWRGRQSG----RDEDALPYDAFVVFDKTQSAVADWVYNE
::.. :: :: .: : : : . . . : . ::. .. .: :: ::
CCDS33 -LCSYLDLPWYLRMVC-QWTQTRRRARNIPLEELQRNLQFHAFISYSGHDSF---WVKNE
600 610 620 630 640 650
900 910 920 930 940 950
pF1KE3 LRGQLEECRGRWALRLCLEERDWLPGKTLFENLWASVYGSRKTLFVLAHTDRVSGLLRAS
: .:: . ....::.::...:::.. ::. . . : :..:::. . : .
CCDS33 LLPNLE----KEGMQICLHERNFVPGKSIVENIITCIEKSYKSIFVLSPNFVQSEWCHYE
660 670 680 690 700 710
960 970 980 990 1000
pF1KE3 FLLAQQRLLEDRKDVVVLVILSPDGRRS---RYVRLRQRLCRQSVLLWPHQPSGQRSFWA
. .:.. :... .. ..:..: : . : : .:.. . :.. : ::.. : . :::
CCDS33 LYFAHHNLFHEGSNSLILILLEPIPQYSIPSSYHKLKSLMARRTYLEWPKEKSKRGLFWA
720 730 740 750 760 770
1010 1020 1030
pF1KE3 QLGMALTRDNHHFYNRNFCQGPTAE
.: :.
CCDS33 NLRAAINIKLTEQAKK
780
1032 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Tue Nov 8 07:02:35 2016 done: Tue Nov 8 07:02:36 2016
Total Scan time: 2.720 Total Display time: 0.130
Function used was FASTA [36.3.4 Apr, 2011]