FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE4455, 475 aa
1>>>pF1KE4455 475 - 475 aa - 475 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 5.1112+/-0.00105; mu= 18.3589+/- 0.063
mean_var=59.8359+/-12.327, 0's: 0 Z-trim(103.5): 26 B-trim: 481 in 1/45
Lambda= 0.165803
statistics sampled from 7447 (7455) to 7447 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.588), E-opt: 0.2 (0.229), width: 16
Scan time: 2.090
The best scores are: opt bits E(32554)
CCDS8200.1 DHCR7 gene_id:1717|Hs108|chr11 ( 475) 3371 815.2 0
CCDS41669.1 TM7SF2 gene_id:7108|Hs108|chr11 ( 418) 546 139.4 7.1e-33
CCDS1545.1 LBR gene_id:3930|Hs108|chr1 ( 615) 425 110.5 5.1e-24
CCDS60846.1 TM7SF2 gene_id:7108|Hs108|chr11 ( 391) 349 92.3 1e-18
>>CCDS8200.1 DHCR7 gene_id:1717|Hs108|chr11 (475 aa)
initn: 3371 init1: 3371 opt: 3371 Z-score: 4354.9 bits: 815.2 E(32554): 0
Smith-Waterman score: 3371; 100.0% identity (100.0% similar) in 475 aa overlap (1-475:1-475)
10 20 30 40 50 60
pF1KE4 MAAKSQPNIPKAKSLDGVTNDRTASQGQWGRAWEVDWFSLASVIFLLLFAPFIVYYFIMA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS82 MAAKSQPNIPKAKSLDGVTNDRTASQGQWGRAWEVDWFSLASVIFLLLFAPFIVYYFIMA
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE4 CDQYSCALTGPVVDIVTGHARLSDIWAKTPPITRKAAQLYTLWVTFQVLLYTSLPDFCHK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS82 CDQYSCALTGPVVDIVTGHARLSDIWAKTPPITRKAAQLYTLWVTFQVLLYTSLPDFCHK
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE4 FLPGYVGGIQEGAVTPAGVVNKYQINGLQAWLLTHLLWFANAHLLSWFSPTIIFDNWIPL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS82 FLPGYVGGIQEGAVTPAGVVNKYQINGLQAWLLTHLLWFANAHLLSWFSPTIIFDNWIPL
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE4 LWCANILGYAVSTFAMVKGYFFPTSARDCKFTGNFFYNYMMGIEFNPRIGKWFDFKLFFN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS82 LWCANILGYAVSTFAMVKGYFFPTSARDCKFTGNFFYNYMMGIEFNPRIGKWFDFKLFFN
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE4 GRPGIVAWTLINLSFAAKQRELHSHVTNAMVLVNVLQAIYVIDFFWNETWYLKTIDICHD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS82 GRPGIVAWTLINLSFAAKQRELHSHVTNAMVLVNVLQAIYVIDFFWNETWYLKTIDICHD
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE4 HFGWYLGWGDCVWLPYLYTLQGLYLVYHPVQLSTPHAVGVLLLGLVGYYIFRVANHQKDL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS82 HFGWYLGWGDCVWLPYLYTLQGLYLVYHPVQLSTPHAVGVLLLGLVGYYIFRVANHQKDL
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE4 FRRTDGRCLIWGRKPKVIECSYTSADGQRHHSKLLVSGFWGVARHFNYVGDLMGSLAYCL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS82 FRRTDGRCLIWGRKPKVIECSYTSADGQRHHSKLLVSGFWGVARHFNYVGDLMGSLAYCL
370 380 390 400 410 420
430 440 450 460 470
pF1KE4 ACGGGHLLPYFYIIYMAILLTHRCLRDEHRCASKYGRDWERYTAAVPYRLLPGIF
:::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS82 ACGGGHLLPYFYIIYMAILLTHRCLRDEHRCASKYGRDWERYTAAVPYRLLPGIF
430 440 450 460 470
>>CCDS41669.1 TM7SF2 gene_id:7108|Hs108|chr11 (418 aa)
initn: 864 init1: 427 opt: 546 Z-score: 703.7 bits: 139.4 E(32554): 7.1e-33
Smith-Waterman score: 901; 37.6% identity (63.8% similar) in 431 aa overlap (46-475:22-418)
20 30 40 50 60 70
pF1KE4 DGVTNDRTASQGQWGRAWEVDWFSLASVIFLLLFAPFIVYYFIMACDQYSCALTGPVVDI
:::. : ......: . : :: ...
CCDS41 MAPTQGPRAPLEFGGPLGAAALLLLLPATMFHLLLAARSGPARLLGPPASL
10 20 30 40 50
80 90 100 110 120 130
pF1KE4 VTGHARLSDIWAKTPPITRKAAQLYTLWVTFQVLLYTSLPDFCHKFLPGYVGGIQEGAVT
: : .: .: .: :. :. .:. :: .::. . ::
CCDS41 -PG---LEVLW--SP----RALLLWLAWLGLQAALY---------LLPAR--KVAEGQEL
60 70 80 90
140 150 160 170 180 190
pF1KE4 PAGVVNKYQINGLQAWLLTHLLWFANAHLLSWFSPTIIFDNWIPLLWCANILGYAVSTFA
.: :::.:: .:: :: .. . . . . . .:: . :.. .. : :
CCDS41 KDKSRLRYPINGFQALVLTALL--VGLGMSAGLPLGALPEMLLPLAFVATLTAFIFSLFL
100 110 120 130 140
200 210 220 230 240 250
pF1KE4 MVKGYFFPTSA-RDCKFTGNFFYNYMMGIEFNPRIGKWFDFKLFFNGRPGIVAWTLINLS
..:. :.:: .:: .:....: :.:::: .:::: : . :::...:.::::.
CCDS41 YMKAQVAPVSALAPGGNSGNPIYDFFLGRELNPRIC-FFDFKYFCELRPGLIGWVLINLA
150 160 170 180 190 200
260 270 280 290 300 310
pF1KE4 FAAKQRELHSHVTNAMVLVNVLQAIYVIDFFWNETWYLKTIDICHDHFGWYLGWGDCVWL
. :. ::.. . :: ::: .: .:: : .:.: : :.:: :: ::..:..:: .:.
CCDS41 LLMKEAELRGSPSLAMWLVNGFQLLYVGDALWHEEAVLTTMDITHDGFGFMLAFGDMAWV
210 220 230 240 250 260
320 330 340 350 360 370
pF1KE4 PYLYTLQGLYLVYHPVQLSTPHAVGVLLLGLVGYYIFRVANHQKDLFRRTDGRCLIWGRK
:. :.::. .:..:: :. : : . :.. .:::::: :: ::. ::.. . . : .
CCDS41 PFTYSLQAQFLLHHPQPLGLPMASVICLINATGYYIFRGANSQKNTFRKNPSDPRVAGLE
270 280 290 300 310 320
380 390 400 410 420 430
pF1KE4 PKVIECSYTSADGQRHHSKLLVSGFWGVARHFNYVGDLMGSLAYCLACGGGHLLPYFYII
. ..: :. ::::::.::..:: ::.:::. .::. : :: .:::::::..
CCDS41 ------TISTATGR----KLLVSGWWGMVRHPNYLGDLIMALAWSLPCGVSHLLPYFYLL
330 340 350 360 370
440 450 460 470
pF1KE4 YMAILLTHRCLRDEHRCASKYGRDWERYTAAVPYRLLPGIF
:.. ::.:: :::..: .::: :..: ::::..: :.
CCDS41 YFTALLVHREARDERQCLQKYGLAWQEYCRRVPYRIMPYIY
380 390 400 410
>>CCDS1545.1 LBR gene_id:3930|Hs108|chr1 (615 aa)
initn: 881 init1: 355 opt: 425 Z-score: 544.8 bits: 110.5 E(32554): 5.1e-24
Smith-Waterman score: 911; 35.0% identity (65.0% similar) in 449 aa overlap (31-475:203-615)
10 20 30 40 50
pF1KE4 MAAKSQPNIPKAKSLDGVTNDRTASQGQWGRAWEVDWFSLASVIFLLLFA-PFIVYYFIM
:: ... :. . .::..:. : ... ...
CCDS15 EEVKLKEIDSKEEKYVAKELAVRTFEVTPIRAKDLE-FGGVPGVFLIMFGLPVFLFLLLL
180 190 200 210 220 230
60 70 80 90 100 110
pF1KE4 ACDQYSCALTGPVVDIVTGHARLSDIWAKTPPITRKAAQLYTLWVTFQVLLYTSLPDFCH
: : . .: ... : ..: .. .: :: .:::.:
CCDS15 MCKQKDPSL----LNFPPPLPALYELWET------RVFGVYLLWFLIQVLFY--------
240 250 260 270
120 130 140 150 160 170
pF1KE4 KFLPGYVGGIQEGAVTPAGVVNKYQINGLQAWLLTHLLWFANAHLLSWFSPTIIFDNWIP
.:: .: . ::. : ::..::. :..:: . .. :.. ......
CCDS15 -LLP--IGKVVEGTPLIDGRRLKYRLNGFYAFILTSAV--IGTSLFQGVEFHYVYSHFLQ
280 290 300 310 320
180 190 200 210 220 230
pF1KE4 LLWCANILGYAVSTFAMVKGYFFPTSARDCKFTGNFFYNYMMGIEFNPRIGKWFDFKLFF
. :... ..:.. .... : . . .:: :....: :.::::: ::.: :
CCDS15 FALAATVFCVVLSVYLYMRSLKAPRNDLSPASSGNAVYDFFIGRELNPRIGT-FDLKYFC
330 340 350 360 370 380
240 250 260 270 280 290
pF1KE4 NGRPGIVAWTLINLSFAAKQRELHSHVTN--AMVLVNVLQAIYVIDFFWNETWYLKTIDI
. :::...:..::: . . ....... ::.::: .: .::.: .::: : :.::
CCDS15 ELRPGLIGWVVINLVMLLAEMKIQDRAVPSLAMILVNSFQLLYVVDALWNEEALLTTMDI
390 400 410 420 430 440
300 310 320 330 340 350
pF1KE4 CHDHFGWYLGWGDCVWLPYLYTLQGLYLVYHPVQLSTPHAVGVLLLGLVGYYIFRVANHQ
:: ::..:..:: ::.:..:..:..::: :: ..: : : ...: : :: ::: :: :
CCDS15 IHDGFGFMLAFGDLVWVPFIYSFQAFYLVSHPNEVSWPMASLIIVLKLCGYVIFRGANSQ
450 460 470 480 490 500
360 370 380 390 400 410
pF1KE4 KDLFRRTDGRCLIWGRKPKVIEC-SYTSADGQRHHSKLLVSGFWGVARHFNYVGDLMGSL
:. ::.. . ::. . . .. :. .:::::.:: .:: ::.:::. .:
CCDS15 KNAFRKNPS-------DPKLAHLKTIHTSTGK----NLLVSGWWGFVRHPNYLGDLIMAL
510 520 530 540 550
420 430 440 450 460 470
pF1KE4 AYCLACGGGHLLPYFYIIYMAILLTHRCLRDEHRCASKYGRDWERYTAAVPYRLLPGIF
:. : :: .:.::::::::...::.:: :::..: .::: ::.: ::::..: :.
CCDS15 AWSLPCGFNHILPYFYIIYFTMLLVHREARDEYHCKKKYGVAWEKYCQRVPYRIFPYIY
560 570 580 590 600 610
>>CCDS60846.1 TM7SF2 gene_id:7108|Hs108|chr11 (391 aa)
initn: 783 init1: 349 opt: 349 Z-score: 449.5 bits: 92.3 E(32554): 1e-18
Smith-Waterman score: 779; 35.3% identity (59.6% similar) in 431 aa overlap (46-475:22-391)
20 30 40 50 60 70
pF1KE4 DGVTNDRTASQGQWGRAWEVDWFSLASVIFLLLFAPFIVYYFIMACDQYSCALTGPVVDI
:::. : ......: . : :: ...
CCDS60 MAPTQGPRAPLEFGGPLGAAALLLLLPATMFHLLLAARSGPARLLGPPASL
10 20 30 40 50
80 90 100 110 120 130
pF1KE4 VTGHARLSDIWAKTPPITRKAAQLYTLWVTFQVLLYTSLPDFCHKFLPGYVGGIQEGAVT
: : .: .: .: :. :. .:. :: .::. . ::
CCDS60 -PG---LEVLW--SP----RALLLWLAWLGLQAALY---------LLPAR--KVAEGQEL
60 70 80 90
140 150 160 170 180 190
pF1KE4 PAGVVNKYQINGLQAWLLTHLLWFANAHLLSWFSPTIIFDNWIPLLWCANILGYAVSTFA
.: :::.:: .:: :: .. . . . . . .:: . :.. .. : :
CCDS60 KDKSRLRYPINGFQALVLTALL--VGLGMSAGLPLGALPEMLLPLAFVATLTAFIFSLFL
100 110 120 130 140
200 210 220 230 240 250
pF1KE4 MVKGYFFPTSA-RDCKFTGNFFYNYMMGIEFNPRIGKWFDFKLFFNGRPGIVAWTLINLS
..:. :.:: .:: .:....: :.:::: .:::: : . :::...:.::::.
CCDS60 YMKAQVAPVSALAPGGNSGNPIYDFFLGRELNPRIC-FFDFKYFCELRPGLIGWVLINLA
150 160 170 180 190 200
260 270 280 290 300 310
pF1KE4 FAAKQRELHSHVTNAMVLVNVLQAIYVIDFFWNETWYLKTIDICHDHFGWYLGWGDCVWL
. :. ::.. . :: ::: .: .:: : .:.: : :.:: :: ::..:..:: .:.
CCDS60 LLMKEAELRGSPSLAMWLVNGFQLLYVGDALWHEEAVLTTMDITHDGFGFMLAFGDMAWV
210 220 230 240 250 260
320 330 340 350 360 370
pF1KE4 PYLYTLQGLYLVYHPVQLSTPHAVGVLLLGLVGYYIFRVANHQKDLFRRTDGRCLIWGRK
:. :.::. .:..:: :. : : . ::: : .
CCDS60 PFTYSLQAQFLLHHPQPLGLPMASVI---------------------------CLINGLE
270 280 290 300
380 390 400 410 420 430
pF1KE4 PKVIECSYTSADGQRHHSKLLVSGFWGVARHFNYVGDLMGSLAYCLACGGGHLLPYFYII
. ..: :. ::::::.::..:: ::.:::. .::. : :: .:::::::..
CCDS60 ------TISTATGR----KLLVSGWWGMVRHPNYLGDLIMALAWSLPCGVSHLLPYFYLL
310 320 330 340 350
440 450 460 470
pF1KE4 YMAILLTHRCLRDEHRCASKYGRDWERYTAAVPYRLLPGIF
:.. ::.:: :::..: .::: :..: ::::..: :.
CCDS60 YFTALLVHREARDERQCLQKYGLAWQEYCRRVPYRIMPYIY
360 370 380 390
475 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Sun Nov 6 01:00:30 2016 done: Sun Nov 6 01:00:31 2016
Total Scan time: 2.090 Total Display time: 0.000
Function used was FASTA [36.3.4 Apr, 2011]