FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE6732, 1134 aa
1>>>pF1KE6732 1134 - 1134 aa - 1134 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 5.3037+/-0.000895; mu= 23.1234+/- 0.054
mean_var=84.5492+/-17.342, 0's: 0 Z-trim(107.0): 215 B-trim: 4 in 1/52
Lambda= 0.139482
statistics sampled from 9084 (9315) to 9084 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.642), E-opt: 0.2 (0.286), width: 16
Scan time: 3.930
The best scores are: opt bits E(32554)
CCDS73251.1 OVCH2 gene_id:341277|Hs108|chr11 ( 565) 809 173.3 1.4e-42
CCDS74669.1 PRSS56 gene_id:646960|Hs108|chr2 ( 603) 681 147.6 8.4e-35
CCDS8487.1 ST14 gene_id:6768|Hs108|chr11 ( 855) 678 147.1 1.6e-34
CCDS12088.1 TMPRSS9 gene_id:360200|Hs108|chr19 (1059) 679 147.4 1.7e-34
CCDS33564.1 TMPRSS2 gene_id:7113|Hs108|chr21 ( 492) 674 146.1 1.9e-34
CCDS54486.1 TMPRSS2 gene_id:7113|Hs108|chr21 ( 529) 674 146.1 2e-34
CCDS58790.1 TMPRSS3 gene_id:64699|Hs108|chr21 ( 453) 672 145.7 2.4e-34
CCDS13686.1 TMPRSS3 gene_id:64699|Hs108|chr21 ( 454) 662 143.6 9.6e-34
CCDS33993.1 TMPRSS11E gene_id:28983|Hs108|chr4 ( 423) 655 142.2 2.4e-33
CCDS43129.2 TMPRSS7 gene_id:344805|Hs108|chr3 ( 717) 641 139.6 2.5e-32
CCDS3518.1 TMPRSS11D gene_id:9407|Hs108|chr4 ( 418) 634 138.0 4.5e-32
CCDS74856.1 TMPRSS6 gene_id:164656|Hs108|chr22 ( 802) 637 138.8 4.8e-32
CCDS13941.1 TMPRSS6 gene_id:164656|Hs108|chr22 ( 811) 637 138.8 4.8e-32
CCDS3520.1 TMPRSS11F gene_id:389208|Hs108|chr4 ( 438) 632 137.6 6.2e-32
CCDS34120.1 KLKB1 gene_id:3818|Hs108|chr4 ( 638) 630 137.3 1.1e-31
CCDS10431.1 TPSAB1 gene_id:7177|Hs108|chr16 ( 275) 625 136.0 1.2e-31
CCDS45469.1 PRSS8 gene_id:5652|Hs108|chr16 ( 343) 621 135.3 2.4e-31
CCDS3521.1 TMPRSS11B gene_id:132724|Hs108|chr4 ( 416) 616 134.4 5.5e-31
CCDS32993.1 HPN gene_id:3249|Hs108|chr19 ( 417) 616 134.4 5.5e-31
CCDS44743.1 TMPRSS4 gene_id:56649|Hs108|chr11 ( 432) 609 133.0 1.5e-30
CCDS10852.1 CTRL gene_id:1506|Hs108|chr16 ( 264) 604 131.8 2.1e-30
CCDS76482.1 TMPRSS4 gene_id:56649|Hs108|chr11 ( 290) 604 131.8 2.3e-30
CCDS53717.1 TMPRSS4 gene_id:56649|Hs108|chr11 ( 397) 604 131.9 2.8e-30
CCDS53716.1 TMPRSS4 gene_id:56649|Hs108|chr11 ( 435) 604 132.0 3e-30
CCDS31684.1 TMPRSS4 gene_id:56649|Hs108|chr11 ( 437) 604 132.0 3.1e-30
CCDS157.1 CELA2A gene_id:63036|Hs108|chr1 ( 269) 595 130.0 7.5e-30
CCDS73391.1 TMPRSS5 gene_id:80975|Hs108|chr11 ( 413) 597 130.5 7.8e-30
CCDS73392.1 TMPRSS5 gene_id:80975|Hs108|chr11 ( 448) 597 130.6 8.2e-30
CCDS44735.1 TMPRSS5 gene_id:80975|Hs108|chr11 ( 457) 597 130.6 8.4e-30
CCDS58185.1 TMPRSS13 gene_id:84000|Hs108|chr11 ( 563) 598 130.8 8.5e-30
CCDS55788.1 TMPRSS13 gene_id:84000|Hs108|chr11 ( 532) 594 130.0 1.4e-29
CCDS41721.1 TMPRSS13 gene_id:84000|Hs108|chr11 ( 567) 594 130.0 1.5e-29
CCDS156.1 CTRC gene_id:11330|Hs108|chr1 ( 268) 590 129.0 1.5e-29
CCDS32490.1 CTRB1 gene_id:1504|Hs108|chr16 ( 263) 585 127.9 3e-29
CCDS75122.1 CORIN gene_id:10699|Hs108|chr4 ( 938) 591 129.6 3.3e-29
CCDS3477.1 CORIN gene_id:10699|Hs108|chr4 (1042) 591 129.7 3.6e-29
CCDS47145.1 PRSS48 gene_id:345062|Hs108|chr4 ( 328) 584 127.8 4e-29
CCDS42110.1 PRSS33 gene_id:260429|Hs108|chr16 ( 280) 577 126.4 9.5e-29
CCDS10430.1 TPSG1 gene_id:25823|Hs108|chr16 ( 321) 577 126.4 1e-28
CCDS32489.1 CTRB2 gene_id:440387|Hs108|chr16 ( 263) 575 125.9 1.2e-28
CCDS30605.1 CELA2B gene_id:51032|Hs108|chr1 ( 269) 572 125.3 1.8e-28
CCDS44881.1 TMPRSS12 gene_id:283471|Hs108|chr12 ( 348) 572 125.4 2.2e-28
CCDS3709.1 PRSS12 gene_id:8492|Hs108|chr4 ( 875) 576 126.6 2.5e-28
CCDS3847.1 F11 gene_id:2160|Hs108|chr4 ( 625) 573 125.9 3e-28
CCDS83495.1 F9 gene_id:2158|Hs108|chrX ( 423) 564 123.9 7.9e-28
CCDS14666.1 F9 gene_id:2158|Hs108|chrX ( 461) 564 123.9 8.4e-28
CCDS14101.1 ACR gene_id:49|Hs108|chr22 ( 421) 563 123.7 9e-28
CCDS1563.1 PRSS38 gene_id:339501|Hs108|chr1 ( 326) 559 122.8 1.3e-27
CCDS47065.1 TMPRSS11A gene_id:339967|Hs108|chr4 ( 418) 553 121.7 3.6e-27
CCDS3519.1 TMPRSS11A gene_id:339967|Hs108|chr4 ( 421) 553 121.7 3.6e-27
>>CCDS73251.1 OVCH2 gene_id:341277|Hs108|chr11 (565 aa)
initn: 989 init1: 602 opt: 809 Z-score: 877.9 bits: 173.3 E(32554): 1.4e-42
Smith-Waterman score: 1117; 34.8% identity (65.3% similar) in 554 aa overlap (3-532:2-544)
10 20 30 40 50
pF1KE6 MGLLASAGLLLLLVI-----GHPRSLGL----KCGIRMVNMKSKEPAVGSRFFSRISSWR
:.. :.::: : :. .:.: .:: .:.. .: .:::: .
CCDS73 MLISRNKLILLLGIVFFERGKSATLSLPKAPSCGQSLVKV---QPWNYFNIFSRILGGS
10 20 30 40 50
60 70 80 90 100 110
pF1KE6 NSTVTGHPWQVSLKSDEHHFCGGSLIQEDRVVTAAHCLDSLSEKQLKNITVTSGEYSLFQ
. ..:::::::. ..:.::::... . :.:::::. ... .....::.:::.: :
CCDS73 QVEKGSYPWQVSLKQRQKHICGGSIVSPQWVITAAHCIA--NRNIVSTLNVTAGEYDLSQ
60 70 80 90 100 110
120 130 140 150 160 170
pF1KE6 KDKQEQNIPVSKIITHPEYNSREYMSPDIALLYLKHKVKFGNAVQPICLPDSDDKVEPGI
: ::.. . .: ::...... :. ::::: . .::. : :::::. .. : :.
CCDS73 TDPGEQTLTIETVIIHPHFSTKKPMDYDIALLKMAGAFQFGHFVGPICLPELREQFEAGF
120 130 140 150 160 170
180 190 200 210 220 230
pF1KE6 LCLSSGWGKISKTSEYSNVLQEMELPIMDDRACNTVLKSMNLPPLGRTMLCAGFPDWGMD
.: ..:::.... . :.::::..:::. . : ..: ... : :.:.::.:::: : :
CCDS73 ICTTAGWGRLTEGGVLSQVLQEVNLPILTWEECVAALLTLKRPISGKTFLCTGFPDGGRD
180 190 200 210 220 230
240 250 260 270 280
pF1KE6 ACQGDSGGPLVCRRGGGIWILAGITSWVAGCAGGSVPVRNNHVKA---SLGIFSKVSELM
:::::::: :.:: : : :::.::: ::. : ::: :. : :::. .:...
CCDS73 ACQGDSGGSLMCRNKKGAWTLAGVTSWGLGCGRG---WRNNVRKSDQGSPGIFTDISKVL
240 250 260 270 280 290
290 300 310 320 330
pF1KE6 DFITQNLFTGLDRG--------QPLSKVGSR---YITKALSSVQEVNGSQRGKGILDMEK
.: ... :: : : . :.. .. ..: : . .. :
CCDS73 PWIHEHIQTGNRRKSSRAWCSEQDVIVSGAEGKLHFPESLHLYYESKQRCVWTLLVPEEM
300 310 320 330 340 350
340 350 360 370 380 390
pF1KE6 QVGCDHDYVSLRSSSGVLFNQRSLMEDDGKQNKRVCGKILPSPLLAETSEAMVPFVSDTE
.: . ......: ... :: :: . . ::. ::: .: .. . ::::.
CCDS73 HVLLSFSHLDVESCHHSYLSMYSL-ED--RPIGKFCGESLPSSILIGSNSLRLKFVSDAT
360 370 380 390 400
400 410 420 430 440 450
pF1KE6 DSGSGFELTVTAVQKSEA-GSGCGSLAILVEEGTNHSAKYPDLYPSNTRCHWFICAPEKH
:...::.:: :.. . :::. :..: ::: .: .::. : ... : :.. : ..:
CCDS73 DNAAGFNLTYKALKPNYIPDSGCSYLTVLFEEGLIQSLNYPENYSDKANCDWIFQASKHH
410 420 430 440 450 460
460 470 480 490 500 510
pF1KE6 IIKLTFEDFAVKFSPNCIYDAVVIYGDSEEKHKLAKLCGMLTITSIFSSSNMTVIYFKSD
.:::.:... .. : .: : :....: :.:...:.:::. . : ..: :.. .: :.::
CCDS73 LIKLSFQSLEIEESGDCTSDYVTVHSDVERKKEIARLCGYDVPTPVLSPSSIMLISFQSD
470 480 490 500 510 520
520 530 540 550 560 570
pF1KE6 GKNRLQGFKARFTILPSESLNKFEPKLPPQNNPVSTVKAILHDVCGIPPFSPQWLSRRIA
.. .::.: ...:
CCDS73 ENGTCRGFQATVSFIPKAVYPDLNISISEDESMFLET
530 540 550 560
>>CCDS74669.1 PRSS56 gene_id:646960|Hs108|chr2 (603 aa)
initn: 593 init1: 201 opt: 681 Z-score: 738.3 bits: 147.6 E(32554): 8.4e-35
Smith-Waterman score: 681; 38.9% identity (64.8% similar) in 270 aa overlap (574-840:104-363)
550 560 570 580 590 600
pF1KE6 PPQNNPVSTVKAILHDVCGIPPFSPQWLSRRIAGGEEACPHCWPWQVGLRFLGDYQCGGA
::.:: : : ::: : :.. :. :::.
CCDS74 RPQALLQDPPEPGPCGERRPSTANVTRAHGRIVGGSAAPPGAWPWLVRLQLGGQPLCGGV
80 90 100 110 120 130
610 620 630 640 650 660
pF1KE6 IINPVWILTAAHCVQLKNNPLSWTIIAGDHDRNLKESTEQVRRAKHIIVHEDFNTLSYDS
.. :.:::::: : : ::. .. .:. :..:.: ...:. : :. .. .
CCDS74 LVAASWVLTAAHCFVGAPNELLWTVTLAEGSRG--EQAEEVP-VNRILPHPKFDPRTFHN
140 150 160 170 180 190
670 680 690 700 710 720
pF1KE6 DIALIQLSSPLEYNSVVRPVCLPHSAEPLFSSEICAVTGWGSISADGGLASRLQQIQVHV
:.::.:: .:. .. .::::::. . .. ::..:::.. :: : ... .: .
CCDS74 DLALVQLWTPVSPGGSARPVCLPQEPQEPPAGTACAIAGWGALFEDGPEAEAVREARVPL
200 210 220 230 240 250
730 740 750 760 770 780
pF1KE6 LEREVCEHTYYSAHPGGITEKMICAGFAASGEKDFCQGDSGGPLVCRHENGPF---VLYG
: ..:.. . :: :.:::. :.: : :::::::::.: : :: ::.:
CCDS74 LSTDTCRR---ALGPGLRPSTMLCAGYLAGGV-DSCQGDSGGPLTCS-EPGPRPREVLFG
260 270 280 290 300
790 800 810 820 830 840
pF1KE6 IVSWGAGCVQPWKPGVFARVMIFLDWIQSKINGPASLQTNNKCKTLKQQLPPPTPSPDSA
..::: :: .: ::::..:: .: ::.: ... :: . . .:. : :: . :.:
CCDS74 VTSWGDGCGEPGKPGVYTRVAVFKDWLQEQMS--ASSSREPSCRELLAWDPPQELQADAA
310 320 330 340 350 360
850 860 870 880 890 900
pF1KE6 SWPGCCSEAELEKPRGFFPTPRYLLDYRGRLECSWVLRVSASSMAKFTIEYLSLLGSPVC
CCDS74 RLCAFYARLCPGSQGACARLAHQQCLQRRRRCELRSLAHTLLGLLRNAQELLGPRPGLRR
370 380 390 400 410 420
>>CCDS8487.1 ST14 gene_id:6768|Hs108|chr11 (855 aa)
initn: 642 init1: 241 opt: 678 Z-score: 733.0 bits: 147.1 E(32554): 1.6e-34
Smith-Waterman score: 678; 41.2% identity (67.5% similar) in 255 aa overlap (561-808:604-850)
540 550 560 570 580 590
pF1KE6 LPSESLNKFEPKLPPQNNPVSTVKAILHDVCGIPPFSPQWLSRRIAGGEEACPHCWPWQV
::. :. : :..:: .: :::::
CCDS84 CLNGLCLSKGNPECDGKEDCSDGSDEKDCDCGLRSFTRQ---ARVVGGTDADEGEWPWQV
580 590 600 610 620 630
600 610 620 630 640
pF1KE6 GLRFLGD-YQCGGAIINPVWILTAAHC-VQLK----NNPLSWTIIAGDHDRNLKESTE-Q
.:. ::. . ::...:.: :...:::: .. . ..: .:: . : ::.. . . :
CCDS84 SLHALGQGHICGASLISPNWLVSAAHCYIDDRGFRYSDPTQWTAFLGLHDQSQRSAPGVQ
640 650 660 670 680 690
650 660 670 680 690 700
pF1KE6 VRRAKHIIVHEDFNTLSYDSDIALIQLSSPLEYNSVVRPVCLPHSAEPLFSSEICAVTGW
:: :.:: : :: ...: ::::..: .: ::.:.:::.::: ... . ... ::::
CCDS84 ERRLKRIISHPFFNDFTFDYDIALLELEKPAEYSSMVRPICLPDASHVFPAGKAIWVTGW
700 710 720 730 740 750
710 720 730 740 750 760
pF1KE6 GSISADGGLASRLQQIQVHVLEREVCEHTYYSAHPGGITEKMICAGFAASGEKDFCQGDS
: . : : ::. ...:... .::. : :: .:.:.:: :: : :::::
CCDS84 GHTQYGGTGALILQKGEIRVINQTTCENLL----PQQITPRMMCVGFL-SGGVDSCQGDS
760 770 780 790 800
770 780 790 800 810 820
pF1KE6 GGPLVCRHENGPFVLYGIVSWGAGCVQPWKPGVFARVMIFLDWIQSKINGPASLQTNNKC
:::: . .: . :.:::: ::.: ::::..:. .: :::.
CCDS84 GGPLSSVEADGRIFQAGVVSWGDGCAQRNKPGVYTRLPLFRDWIKENTGV
810 820 830 840 850
830 840 850 860 870 880
pF1KE6 KTLKQQLPPPTPSPDSASWPGCCSEAELEKPRGFFPTPRYLLDYRGRLECSWVLRVSASS
>>CCDS12088.1 TMPRSS9 gene_id:360200|Hs108|chr19 (1059 aa)
initn: 764 init1: 348 opt: 679 Z-score: 732.9 bits: 147.4 E(32554): 1.7e-34
Smith-Waterman score: 690; 34.9% identity (63.8% similar) in 318 aa overlap (528-843:159-458)
500 510 520 530 540 550
pF1KE6 TITSIFSSSNMTVIYFKSDGKNRLQGFKARFTILPSESLNKFEPKLPPQNNPVSTVKAIL
:. :. ..: .:. :.. : .
CCDS12 GTIVSAELTGRHKGPLAERDFKSGRCPGNSFSCGNSQCVTKVNPECDDQED-CSDGSDEA
130 140 150 160 170 180
560 570 580 590 600 610
pF1KE6 HDVCGIPPFSPQW-LSRRIAGGEEACPHCWPWQVGLRFLGDYQCGGAIINPVWILTAAHC
: ::. .: : .. ::.:: :: : .:::..:: .. ::.:::: :...::::
CCDS12 HCECGL---QPAWRMAGRIVGGMEASPGEFPWQASLRENKEHFCGAAIINARWLVSAAHC
190 200 210 220 230 240
620 630 640 650 660 670
pF1KE6 VQLKNNPLSWTIIAGDHDRNLKESTEQVRRAKHIIVHEDFNTLSYDSDIALIQLSSPLEY
. ..: .:. .: . .:.. .. .:. : .:. . : :.:...:.::: .
CCDS12 FNEFQDPTKWVAYVGATYLSGSEASTVRAQVVQIVKHPLYNADTADFDVAVLELTSPLPF
250 260 270 280 290 300
680 690 700 710 720 730
pF1KE6 NSVVRPVCLPHSAEPLFSSEICAVTGWGSISADGGLASR-LQQIQVHVLEREVCEHTYYS
. ..::::: ... . :. : ..::: .. : . . ::. :..:.. .: :
CCDS12 GRHIQPVCLPAATHIFPPSKKCLISGWGYLKEDFLVKPEVLQKATVELLDQALCASLY--
310 320 330 340 350 360
740 750 760 770 780 790
pF1KE6 AHPGGITEKMICAGFAASGEKDFCQGDSGGPLVCRHENGPFVLYGIVSWGAGCVQPWKPG
.: ..:..:.:::. .:. : :::::::::::.. .: : : :::::: ::.. .::
CCDS12 GH--SLTDRMVCAGYL-DGKVDSCQGDSGGPLVCEEPSGRFFLAGIVSWGIGCAEARRPG
370 380 390 400 410
800 810 820 830 840 850
pF1KE6 VFARVMIFLDWIQSKINGPASLQTNNKCKTLKQQLPPPTPSPDSASWPGCCSEAELEKPR
:.::: . ::: :....: . :.:. :..::
CCDS12 VYARVTRLRDWI---------LEATTKASMPLAPTMAPAPAAPSTAWPTSPESPVVSTPT
420 430 440 450 460 470
860 870 880 890 900 910
pF1KE6 GFFPTPRYLLDYRGRLECSWVLRVSASSMAKFTIEYLSLLGSPVCQDSVLIIYEERHSKR
CCDS12 KSMQALSTVPLDWVTVPKLQECGARPAMEKPTRVVGGFGAASGEVPWQVSLKEGSRHFCG
480 490 500 510 520 530
>--
initn: 634 init1: 231 opt: 550 Z-score: 592.6 bits: 121.4 E(32554): 1.1e-26
Smith-Waterman score: 826; 26.0% identity (49.1% similar) in 755 aa overlap (59-811:516-1057)
30 40 50 60 70 80
pF1KE6 MVNMKSKEPAVGSRFFSRISSWRNSTVTGHPWQVSLKSDEHHFCGGSLIQEDRVVTAAHC
::::::: .::::.... . ...::::
CCDS12 VPKLQECGARPAMEKPTRVVGGFGAASGEVPWQVSLKEGSRHFCGATVVGDRWLLSAAHC
490 500 510 520 530 540
90 100 110 120 130 140
pF1KE6 LDSLSEKQLKNITVTSGEYSLFQKDKQEQNIPVSKIITHPEYNSREYMSPDIALLYLKHK
.. . .:.. . : ::. . .: . ... :: :: .. :.:.: :
CCDS12 FNHTKVEQVR---AHLGTASLLGLGGSPVKIGLRRVVLHPLYNPG-ILDFDLAVLELASP
550 560 570 580 590 600
150 160 170 180 190 200
pF1KE6 VKFGNAVQPICLPDSDDKVEPGILCLSSGWGKISK-TSEYSNVLQEMELPIMDDRACNTV
. :.. .::.::: . .: : :. ::::. .. .. ..::. . :.:...: .:
CCDS12 LAFNKYIQPVCLPLAIQKFPVGRKCMISGWGNTQEGNATKPELLQKASVGIIDQKTC-SV
610 620 630 640 650 660
210 220 230 240 250 260
pF1KE6 LKSMNLPPLGRTMLCAGFPDWGMDACQGDSGGPLVCRRGGGIWILAGITSWVAGCAGGSV
: ...: :.:::: . .:.:::::::::.:... :.. ::::.:: ::: .
CCDS12 LYNFSLTD---RMICAGFLEGKVDSCQGDSGGPLACEEAPGVFYLAGIVSWGIGCAQVKK
670 680 690 700 710
270 280 290 300 310 320
pF1KE6 PVRNNHVKASLGIFSKVSELMDFITQNLFTGLDRGQPLSKVGSRYITKALSSVQEVNGSQ
: :.......: .: :. .::
CCDS12 P----------GVYTRITRLKGWIL-----------------------------EIMSSQ
720 730
330 340 350 360 370 380
pF1KE6 RGKGILDMEKQVGCDHDYVSLRSSSGVLFNQRSLMEDDGKQNKRVCGKILPSPLLAETSE
: :. ..
CCDS12 --------------------------------------------------PLPMSPPSTT
740
390 400 410 420 430 440
pF1KE6 AMVPFVSDTEDSGSGFELTVTAVQKSEAGSGCGSLAILVEEGTNHSAKYPDLYPSNTRCH
:. .: .: ::: .. :. : .:
CCDS12 RMLATTSPRTTAG----LTVPGATPSRPTPGAAS--------------------------
750 760 770
450 460 470 480 490 500
pF1KE6 WFICAPEKHIIKLTFEDFAVKFSPNCIYDAVVIYGDSEEKHKLAKLCGMLTITSIFSSSN
.:. ..:.
CCDS12 --------------------------------------------------RVTGQPANST
780
510 520 530 540 550 560
pF1KE6 MTVIYFKSDGKNRLQGFKARFTILPSESLNKFEPKLPPQNNPVSTVKAILHDVCGIPPFS
.... . :.. : . : .:... : : ::. : .
CCDS12 LSAVSTTARGQT------------------------PFPDAPEATTHTQLPD-CGLAPAA
790 800 810 820
570 580 590 600 610 620
pF1KE6 PQWLSRRIAGGEEACPHCWPWQVGLRFLG-DYQCGGAIINPVWILTAAHCVQLKNNPLSW
:.: :.:: : :::::.: . ...::.... :.:.:::: .. ..: .:
CCDS12 ---LTR-IVGGSAAGRGEWPWQVSLWLRRREHRCGAVLVAERWLLSAAHCFDVYGDPKQW
830 840 850 860 870
630 640 650 660 670 680
pF1KE6 TIIAGDHDRNLKESTEQVRRAKHIIVHEDFNTLSYDSDIALIQLSSPLEYNSVVRPVCLP
. . : :. . :..:. .: : .: . : :.::..:..:.. . .:::.:::
CCDS12 AAFLGTP--FLSGAEGQLERVARIYKHPFYNLYTLDYDVALLELAGPVRRSRLVRPICLP
880 890 900 910 920 930
690 700 710 720 730 740
pF1KE6 HSAEPLFSSEICAVTGWGSISADGGLASRLQQIQVHVLEREVCEHTYYSAHPGGITEKMI
. : .. :..:::::. :..: .::. :..: ...:.. : : :. .:.
CCDS12 EPAPRPPDGTRCVITGWGSVREGGSMARQLQKAAVRLLSEQTCRRFY----PVQISSRML
940 950 960 970 980 990
750 760 770 780 790 800
pF1KE6 CAGFAASGEKDFCQGDSGGPLVCRHENGPFVLYGIVSWGAGCVQPWKPGVFARVMIFLDW
:::: .: : :.::.::::.::. .: .:: :..::: :: .: :::..:: :
CCDS12 CAGFPQGGV-DSCSGDAGGPLACREPSGRWVLTGVTSWGYGCGRPHFPGVYTRVAAVRGW
1000 1010 1020 1030 1040 1050
810 820 830 840 850 860
pF1KE6 IQSKINGPASLQTNNKCKTLKQQLPPPTPSPDSASWPGCCSEAELEKPRGFFPTPRYLLD
: ..:
CCDS12 IGQHIQE
>>CCDS33564.1 TMPRSS2 gene_id:7113|Hs108|chr21 (492 aa)
initn: 742 init1: 345 opt: 674 Z-score: 731.9 bits: 146.1 E(32554): 1.9e-34
Smith-Waterman score: 674; 40.6% identity (66.4% similar) in 256 aa overlap (561-813:244-492)
540 550 560 570 580 590
pF1KE6 LPSESLNKFEPKLPPQNNPVSTVKAILHDVCGIPPFSPQWLSRRIAGGEEACPHCWPWQV
::. : . . ::.::: : : :::::
CCDS33 TSAGNVDIYKKLYHSDACSSKAVVSLRCIACGVNLNSSR--QSRIVGGESALPGAWPWQV
220 230 240 250 260 270
600 610 620 630 640
pF1KE6 GLRFLGDYQCGGAIINPVWILTAAHCVQLK-NNPLSWTIIAGDHDRNLKESTEQVRRAKH
.:. . . :::.::.: ::.::::::. ::: :: .:: ... . :
CCDS33 SLHVQNVHVCGGSIITPEWIVTAAHCVEKPLNNPWHWTAFAGILRQSFMFYGAGYQVEK-
280 290 300 310 320 330
650 660 670 680 690 700
pF1KE6 IIVHEDFNTLSYDSDIALIQLSSPLEYNSVVRPVCLPHSAEPLFSSEICAVTGWGSISAD
.: : .... . ..::::..:..:: .:..:.:::::. . : ..: ..:::.
CCDS33 VISHPNYDSKTKNNDIALMKLQKPLTFNDLVKPVCLPNPGMMLQPEQLCWISGWGATEEK
340 350 360 370 380 390
710 720 730 740 750 760
pF1KE6 GGLASRLQQIQVHVLEREVCEHTYYSAHPGGITEKMICAGFAASGEKDFCQGDSGGPLVC
: . :. .: ..: . :. : .. . :: :::::: .:. : ::::::::::
CCDS33 GKTSEVLNAAKVLLIETQRCNSRY--VYDNLITPAMICAGFL-QGNVDSCQGDSGGPLVT
400 410 420 430 440
770 780 790 800 810 820
pF1KE6 RHENGPFVLYGIVSWGAGCVQPWKPGVFARVMIFLDWI--QSKINGPASLQTNNKCKTLK
.:. . : : .:::.::.. ..:::.. ::.: ::: : . .:
CCDS33 S-KNNIWWLIGDTSWGSGCAKAYRPGVYGNVMVFTDWIYRQMRADG
450 460 470 480 490
830 840 850 860 870 880
pF1KE6 QQLPPPTPSPDSASWPGCCSEAELEKPRGFFPTPRYLLDYRGRLECSWVLRVSASSMAKF
>>CCDS54486.1 TMPRSS2 gene_id:7113|Hs108|chr21 (529 aa)
initn: 742 init1: 345 opt: 674 Z-score: 731.4 bits: 146.1 E(32554): 2e-34
Smith-Waterman score: 674; 40.6% identity (66.4% similar) in 256 aa overlap (561-813:281-529)
540 550 560 570 580 590
pF1KE6 LPSESLNKFEPKLPPQNNPVSTVKAILHDVCGIPPFSPQWLSRRIAGGEEACPHCWPWQV
::. : . . ::.::: : : :::::
CCDS54 TSAGNVDIYKKLYHSDACSSKAVVSLRCIACGVNLNSSR--QSRIVGGESALPGAWPWQV
260 270 280 290 300
600 610 620 630 640
pF1KE6 GLRFLGDYQCGGAIINPVWILTAAHCVQLK-NNPLSWTIIAGDHDRNLKESTEQVRRAKH
.:. . . :::.::.: ::.::::::. ::: :: .:: ... . :
CCDS54 SLHVQNVHVCGGSIITPEWIVTAAHCVEKPLNNPWHWTAFAGILRQSFMFYGAGYQVEK-
310 320 330 340 350 360
650 660 670 680 690 700
pF1KE6 IIVHEDFNTLSYDSDIALIQLSSPLEYNSVVRPVCLPHSAEPLFSSEICAVTGWGSISAD
.: : .... . ..::::..:..:: .:..:.:::::. . : ..: ..:::.
CCDS54 VISHPNYDSKTKNNDIALMKLQKPLTFNDLVKPVCLPNPGMMLQPEQLCWISGWGATEEK
370 380 390 400 410 420
710 720 730 740 750 760
pF1KE6 GGLASRLQQIQVHVLEREVCEHTYYSAHPGGITEKMICAGFAASGEKDFCQGDSGGPLVC
: . :. .: ..: . :. : .. . :: :::::: .:. : ::::::::::
CCDS54 GKTSEVLNAAKVLLIETQRCNSRY--VYDNLITPAMICAGFL-QGNVDSCQGDSGGPLVT
430 440 450 460 470 480
770 780 790 800 810 820
pF1KE6 RHENGPFVLYGIVSWGAGCVQPWKPGVFARVMIFLDWI--QSKINGPASLQTNNKCKTLK
.:. . : : .:::.::.. ..:::.. ::.: ::: : . .:
CCDS54 S-KNNIWWLIGDTSWGSGCAKAYRPGVYGNVMVFTDWIYRQMRADG
490 500 510 520
830 840 850 860 870 880
pF1KE6 QQLPPPTPSPDSASWPGCCSEAELEKPRGFFPTPRYLLDYRGRLECSWVLRVSASSMAKF
>>CCDS58790.1 TMPRSS3 gene_id:64699|Hs108|chr21 (453 aa)
initn: 681 init1: 224 opt: 672 Z-score: 730.2 bits: 145.7 E(32554): 2.4e-34
Smith-Waterman score: 672; 35.3% identity (65.3% similar) in 331 aa overlap (483-811:131-447)
460 470 480 490 500 510
pF1KE6 PEKHIIKLTFEDFAVKFSPNCIYDAVVIYGDSEEKHKLAKLCGMLTITSIFSSSNMTVIY
:. . : :..: . : ::.:. :
CCDS58 GEDEYRCVRVGGQNAVLQVFTAASWKTMCSDDWKGHYANVACAQLGFPSYVSSDNLRVSS
110 120 130 140 150 160
520 530 540 550 560 570
pF1KE6 FKSDGKNRLQGFKARFTILPSESLNKFEPKLPPQNNPVST-VKAILHDVCGIPPFSPQWL
. .:. : . : . .::..... .. .. ... .: : .. .:: .
CCDS58 L--EGQFREE-FVSIDHLLPDDKVTALHHSVYVREGCASGHVVTLQCTACG----HRRGY
170 180 190 200 210
580 590 600 610 620 630
pF1KE6 SRRIAGGEEACPHCWPWQVGLRFLGDYQCGGAIINPVWILTAAHCVQLKNNPLSWTIIAG
: ::.::. . ::::..:.: : . :::..:.:.::.:::::: : :::: .:
CCDS58 SSRIVGGNMSLLSQWPWQASLQFQGYHLCGGSVITPLWIITAAHCVYDLYLPKSWTIQVG
220 230 240 250 260 270
640 650 660 670 680 690
pF1KE6 DHDRNLKESTEQVRRAKHIIVHEDFNTLSYDSDIALIQLSSPLEYNSVVRPVCLPHSAEP
.: .. . ...:. : .. .::::..:..:: .: ...:::::.: :
CCDS58 L--VSLLDNPAPSHLVEKIVYHSKYKPKRLGNDIALMKLAGPLTFNEMIQPVCLPNSEEN
280 290 300 310 320 330
700 710 720 730 740 750
pF1KE6 LFSSEICAVTGWGSISADGGLASR-LQQIQVHVLEREVCEHTYYSAHPGGITEKMICAGF
. ....: ..:::. . ::: :: :.. : .. ..:.: ... : :. .:.:::.
CCDS58 FPDGKVCWTSGWGA-TEDGGDASPVLNHAAVPLISNKICNH--RDVYGGIISPSMLCAGY
340 350 360 370 380
760 770 780 790 800 810
pF1KE6 AASGEKDFCQGDSGGPLVCRHENGPFVLYGIVSWGAGCVQPWKPGVFARVMIFLDWIQSK
..: : :::::::::::. : . : : .:.: ::.. ::::..:: :::::. .
CCDS58 LTGGV-DSCQGDSGGPLVCQ-ERRLWKLVGATSFGIGCAEVNKPGVYTRVTSFLDWIHEQ
390 400 410 420 430 440
820 830 840 850 860 870
pF1KE6 INGPASLQTNNKCKTLKQQLPPPTPSPDSASWPGCCSEAELEKPRGFFPTPRYLLDYRGR
.
CCDS58 MERDLKT
450
>>CCDS13686.1 TMPRSS3 gene_id:64699|Hs108|chr21 (454 aa)
initn: 566 init1: 228 opt: 662 Z-score: 719.3 bits: 143.6 E(32554): 9.6e-34
Smith-Waterman score: 662; 34.7% identity (64.7% similar) in 331 aa overlap (483-811:131-448)
460 470 480 490 500 510
pF1KE6 PEKHIIKLTFEDFAVKFSPNCIYDAVVIYGDSEEKHKLAKLCGMLTITSIFSSSNMTVIY
:. . : :..: . : ::.:. :
CCDS13 GEDEYRCVRVGGQNAVLQVFTAASWKTMCSDDWKGHYANVACAQLGFPSYVSSDNLRVSS
110 120 130 140 150 160
520 530 540 550 560 570
pF1KE6 FKSDGKNRLQGFKARFTILPSESLNKFEPKLPPQNNPVST-VKAILHDVCGIPPFSPQWL
. .:. : . : . .::..... .. .. ... .: : .. .:: .
CCDS13 L--EGQFREE-FVSIDHLLPDDKVTALHHSVYVREGCASGHVVTLQCTACG----HRRGY
170 180 190 200 210
580 590 600 610 620 630
pF1KE6 SRRIAGGEEACPHCWPWQVGLRFLGDYQCGGAIINPVWILTAAHCVQLKNNPLSWTIIAG
: ::.::. . ::::..:.: : . :::..:.:.::.:::::: : :::: .:
CCDS13 SSRIVGGNMSLLSQWPWQASLQFQGYHLCGGSVITPLWIITAAHCVYDLYLPKSWTIQVG
220 230 240 250 260 270
640 650 660 670 680 690
pF1KE6 DHDRNLKESTEQVRRAKHIIVHEDFNTLSYDSDIALIQLSSPLEYNSVVRPVCLPHSAEP
.: .. . ...:. : .. .::::..:..:: .: ...:::::.: :
CCDS13 L--VSLLDNPAPSHLVEKIVYHSKYKPKRLGNDIALMKLAGPLTFNEMIQPVCLPNSEEN
280 290 300 310 320 330
700 710 720 730 740 750
pF1KE6 LFSSEICAVTGWGSISADGGLASR-LQQIQVHVLEREVCEHTYYSAHPGGITEKMICAGF
. ....: ..:::. .: :: :.. : .. ..:.: ... : :. .:.:::.
CCDS13 FPDGKVCWTSGWGATEDGAGDASPVLNHAAVPLISNKICNH--RDVYGGIISPSMLCAGY
340 350 360 370 380
760 770 780 790 800 810
pF1KE6 AASGEKDFCQGDSGGPLVCRHENGPFVLYGIVSWGAGCVQPWKPGVFARVMIFLDWIQSK
..: : :::::::::::. : . : : .:.: ::.. ::::..:: :::::. .
CCDS13 LTGGV-DSCQGDSGGPLVCQ-ERRLWKLVGATSFGIGCAEVNKPGVYTRVTSFLDWIHEQ
390 400 410 420 430 440
820 830 840 850 860 870
pF1KE6 INGPASLQTNNKCKTLKQQLPPPTPSPDSASWPGCCSEAELEKPRGFFPTPRYLLDYRGR
.
CCDS13 MERDLKT
450
>>CCDS33993.1 TMPRSS11E gene_id:28983|Hs108|chr4 (423 aa)
initn: 608 init1: 225 opt: 655 Z-score: 712.1 bits: 142.2 E(32554): 2.4e-33
Smith-Waterman score: 655; 38.2% identity (65.1% similar) in 275 aa overlap (541-810:153-420)
520 530 540 550 560
pF1KE6 IYFKSDGKNRLQGFKARFTILPSESLNKFEPKLPPQNNPVSTVK-----AILHDVCGIPP
::. :.. .. .. . :. ::
CCDS33 CRFHSTEDPETVDKIVQLVLHEKLQDAVGPPKVDPHSVKIKKINKTETDSYLNHCCGTRR
130 140 150 160 170 180
570 580 590 600 610 620
pF1KE6 FSPQWLSRRIAGGEEACPHCWPWQVGLRFLGDYQCGGAIINPVWILTAAHCVQLKNNPLS
. : ::.:: :. ::::..:.. :...::...:: .:...:::: .::
CCDS33 SKTLGQSLRIVGGTEVEEGEWPWQASLQWDGSHRCGATLINATWLVSAAHCFTTYKNPAR
190 200 210 220 230 240
630 640 650 660 670 680
pF1KE6 WTIIAGDHDRNLKESTEQVRRAKHIIVHEDFNTLSYDSDIALIQLSSPLEYNSVVRPVCL
:: : ..: : . : ..::::: .. :.: ::.: .::::. :...:. :::
CCDS33 WTASFG---VTIKPSKMK-RGLRRIIVHEKYKHPSHDYDISLAELSSPVPYTNAVHRVCL
250 260 270 280 290
690 700 710 720 730 740
pF1KE6 PHSAEPLFSSEICAVTGWGSISADGGLASRLQQIQVHVLEREVCEHTYYSAHPGGITEKM
: .. . ... :::.:... :: ..:.: :: ... .:.. .:. .:: .:
CCDS33 PDASYEFQPGDVMFVTGFGALKNDGYSQNHLRQAQVTLIDATTCNEP--QAYNDAITPRM
300 310 320 330 340 350
750 760 770 780 790 800
pF1KE6 ICAGFAASGEKDFCQGDSGGPLVCRHENGPFVLYGIVSWGAGCVQPWKPGVFARVMIFLD
.::: . :. : :::::::::: . : :::::: :..: ::::..:: . :
CCDS33 LCAG-SLEGKTDACQGDSGGPLVSSDARDIWYLAGIVSWGDECAKPNKPGVYTRVTALRD
360 370 380 390 400 410
810 820 830 840 850 860
pF1KE6 WIQSKINGPASLQTNNKCKTLKQQLPPPTPSPDSASWPGCCSEAELEKPRGFFPTPRYLL
:: ::
CCDS33 WITSKTGI
420
>>CCDS43129.2 TMPRSS7 gene_id:344805|Hs108|chr3 (717 aa)
initn: 609 init1: 174 opt: 641 Z-score: 693.8 bits: 139.6 E(32554): 2.5e-32
Smith-Waterman score: 641; 41.0% identity (68.0% similar) in 244 aa overlap (574-811:479-713)
550 560 570 580 590 600
pF1KE6 PPQNNPVSTVKAILHDVCGIPPFSPQWLSRRIAGGEEACPHCWPWQVGLRFLGDYQCGGA
:: :: .. :::::.:.:.:. ::..
CCDS43 QNAKCDGTVDCPDGSDEEGCTCSRSSSALHRIIGGTDTLEGGWPWQVSLHFVGSAYCGAS
450 460 470 480 490 500
610 620 630 640 650 660
pF1KE6 IINPVWILTAAHCVQLK--NNPLSWTIIAGDHDRNLKESTEQVRRAKHIIVHEDFNTLSY
.:. :.:.:::: . . ..: :: : . .. . . ::: :.::: .:. ..
CCDS43 VISREWLLSAAHCFHGNRLSDPTPWTAHLGMYVQGNAKFVSPVRR---IVVHEYYNSQTF
510 520 530 540 550 560
670 680 690 700 710
pF1KE6 DSDIALIQLSS--PLEYNSVVRPVCLPHSAEPLFSSEICAVTGWGSIS-ADGGLASRLQQ
: ::::.::: : .....:.:.: ... . :.: : ::::: ::. . :::
CCDS43 DYDIALLQLSIAWPETLKQLIQPICIPPTGQRVRSGEKCWVTGWGRRHEADNKGSLVLQQ
570 580 590 600 610 620
720 730 740 750 760 770
pF1KE6 IQVHVLEREVCEHTYYSAHPGGITEKMICAGFAASGEKDFCQGDSGGPLVCRHE-NGPFV
.:..... .: :: : :: .:.:::. ::..: :.::::::: ::.. .: ..
CCDS43 AEVELIDQTLCVSTY-----GIITSRMLCAGIM-SGKRDACKGDSGGPLSCRRKSDGKWI
630 640 650 660 670
780 790 800 810 820 830
pF1KE6 LYGIVSWGAGCVQPWKPGVFARVMIFLDWIQSKINGPASLQTNNKCKTLKQQLPPPTPSP
: :::::: : .: :::..:: :. ::.. .
CCDS43 LTGIVSWGHGSGRPNFPGVYTRVSNFVPWIHKYVPSLL
680 690 700 710
840 850 860 870 880 890
pF1KE6 DSASWPGCCSEAELEKPRGFFPTPRYLLDYRGRLECSWVLRVSASSMAKFTIEYLSLLGS
1134 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Tue Nov 8 15:49:45 2016 done: Tue Nov 8 15:49:45 2016
Total Scan time: 3.930 Total Display time: 0.120
Function used was FASTA [36.3.4 Apr, 2011]