FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE5692, 501 aa
1>>>pF1KE5692 501 - 501 aa - 501 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 5.2419+/-0.000835; mu= 18.2866+/- 0.050
mean_var=65.5744+/-13.105, 0's: 0 Z-trim(106.2): 65 B-trim: 2 in 1/51
Lambda= 0.158383
statistics sampled from 8787 (8849) to 8787 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.645), E-opt: 0.2 (0.272), width: 16
Scan time: 3.160
The best scores are: opt bits E(32554)
CCDS2707.1 CYP8B1 gene_id:1582|Hs108|chr3 ( 501) 3447 796.7 0
CCDS13419.1 PTGIS gene_id:5740|Hs108|chr20 ( 500) 1301 306.3 5.1e-83
CCDS6171.1 CYP7A1 gene_id:1581|Hs108|chr8 ( 504) 1087 257.4 2.7e-68
CCDS6180.1 CYP7B1 gene_id:9420|Hs108|chr8 ( 506) 1006 238.9 1e-62
CCDS4916.1 CYP39A1 gene_id:51302|Hs108|chr6 ( 469) 340 86.7 6.1e-17
>>CCDS2707.1 CYP8B1 gene_id:1582|Hs108|chr3 (501 aa)
initn: 3447 init1: 3447 opt: 3447 Z-score: 4254.0 bits: 796.7 E(32554): 0
Smith-Waterman score: 3447; 99.8% identity (99.8% similar) in 501 aa overlap (1-501:1-501)
10 20 30 40 50 60
pF1KE5 MVLWGPVLGALLVVIAGYLCLPGMLRQRRPWEPPLDKGTVPWLGHAMAFRKNMFEFLKRM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS27 MVLWGPVLGALLVVIAGYLCLPGMLRQRRPWEPPLDKGTVPWLGHAMAFRKNMFEFLKRM
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE5 RTKHGDVFTVQLGGQYFTFVMDPLSFGPILKDTQRKLDFGQYAKKLVLKVFGYRSVQGDH
::::::::::::::::::::::::::: ::::::::::::::::::::::::::::::::
CCDS27 RTKHGDVFTVQLGGQYFTFVMDPLSFGSILKDTQRKLDFGQYAKKLVLKVFGYRSVQGDH
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE5 EMIHSASTKHLRGDGLKDLNETMLDSLSFVMLTSKGWSLDASCWHEDSLFRFCYYILFTA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS27 EMIHSASTKHLRGDGLKDLNETMLDSLSFVMLTSKGWSLDASCWHEDSLFRFCYYILFTA
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE5 GYLSLFGYTKDKEQDLLQAGELFMEFRKFDLLFPRFVYSLLWPREWLEVGRLQRLFHKML
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS27 GYLSLFGYTKDKEQDLLQAGELFMEFRKFDLLFPRFVYSLLWPREWLEVGRLQRLFHKML
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE5 SVSHSQEKEGISNWLGNMLQFLREQGVPSAMQDKFNFMMLWASQGNTGPTSFWALLYLLK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS27 SVSHSQEKEGISNWLGNMLQFLREQGVPSAMQDKFNFMMLWASQGNTGPTSFWALLYLLK
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE5 HPEAIRAVREEATQVLGEARLETKQSFAFKLGALQHTPVLDSVVEETLRLRAAPTLLRLV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS27 HPEAIRAVREEATQVLGEARLETKQSFAFKLGALQHTPVLDSVVEETLRLRAAPTLLRLV
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE5 HEDYTLKMSSGQEYLFRHGDILALFPYLSVHMDPDIHPEPTVFKYDRFLNPNGSRKVDFF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS27 HEDYTLKMSSGQEYLFRHGDILALFPYLSVHMDPDIHPEPTVFKYDRFLNPNGSRKVDFF
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE5 KTGKKIHHYTMPWGSGVSICPGRFFALSEVKLFILLMVTHFDLELVDPDTPLPHVDPQRW
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS27 KTGKKIHHYTMPWGSGVSICPGRFFALSEVKLFILLMVTHFDLELVDPDTPLPHVDPQRW
430 440 450 460 470 480
490 500
pF1KE5 GFGTMQPSHDVRFRYRLHPTE
:::::::::::::::::::::
CCDS27 GFGTMQPSHDVRFRYRLHPTE
490 500
>>CCDS13419.1 PTGIS gene_id:5740|Hs108|chr20 (500 aa)
initn: 1290 init1: 907 opt: 1301 Z-score: 1604.0 bits: 306.3 E(32554): 5.1e-83
Smith-Waterman score: 1301; 40.9% identity (69.2% similar) in 506 aa overlap (4-499:3-500)
10 20 30 40 50 60
pF1KE5 MVLWGPVLGALLVVIAGYLCLPGMLRQRRPWEPPLDKGTVPWLGHAMAFRKNMFEFLKRM
:. .:: : ... : : . : ::: ::::: :..::::.:. : :. :: ::
CCDS13 MAWAALLGLLAALL--LLLLLSRRRTRRPGEPPLDLGSIPWLGYALDFGKDAASFLTRM
10 20 30 40 50
70 80 90 100 110 120
pF1KE5 RTKHGDVFTVQLGGQYFTFVMDPLSFGPILKDTQRKLDFGQYAKKLVLKVFGYRSVQGDH
. ::::.::. .::.: : ..:: :. .. . . .::: :: :. ..: .:: :
CCDS13 KEKHGDIFTILVGGRYVTVLLDPHSYDAVVWEPRTRLDFHAYAIFLMERIF---DVQLPH
60 70 80 90 100 110
130 140 150 160 170
pF1KE5 EMIHSASTKH---LRGDGLKDLNETMLDSLSFVMLTSKGWSLDA-SCWHEDSLFRFCYYI
. ... : :. :.:.: .: :.: : . .: : ::: .:. : : .
CCDS13 YSPSDEKARMKLTLLHRELQALTEAMYTNLHAVLL---GDATEAGSGWHEMGLLDFSYSF
120 130 140 150 160 170
180 190 200 210 220 230
pF1KE5 LFTAGYLSLFGYT------KDKEQDLLQAGELFMEFRKFDLLFPRFVYSLLWPREWLEVG
:. ::::.:.: ... :: ......: ::..: :.:... . : . ..
CCDS13 LLRAGYLTLYGIEALPRTHESQAQDRVHSADVFHTFRQLDRLLPKLARGSLSVGDKDHMC
180 190 200 210 220 230
240 250 260 270 280 290
pF1KE5 RLQRLFHKMLSVSHSQEKEGISNWLGNMLQFLREQGVPSAMQDKFNFMMLWASQGNTGPT
.. . :.:: .. .. :.:: ..: :.:.:: :: . ..:::.::: ::.
CCDS13 SVKSRLWKLLSPARLARRAHRSKWLESYLLHLEEMGVSEEMQARALVLQLWATQGNMGPA
240 250 260 270 280 290
300 310 320 330 340 350
pF1KE5 SFWALLYLLKHPEAIRAVREEATQVLGEARLETKQSFAFKLGALQHTPVLDSVVEETLRL
.:: ::.:::.:::. ::: : ..: .:. ..:. .. .:. :::::::. :.:::
CCDS13 AFWLLLFLLKNPEALAAVRGELESILWQAEQPVSQTTTLPQKVLDSTPVLDSVLSESLRL
300 310 320 330 340 350
360 370 380 390 400 410
pF1KE5 RAAPTLLRLVHEDYTLKMSSGQEYLFRHGDILALFPYLSVHMDPDIHPEPTVFKYDRFLN
::: . : : : .. :..:.:. .:.:: : :::.:: . ::.:. .: ::::.::::
CCDS13 TAAPFITREVVVDLAMPMADGREFNLRRGDRLLLFPFLSPQRDPEIYTDPEVFKYNRFLN
360 370 380 390 400 410
420 430 440 450 460 470
pF1KE5 PNGSRKVDFFKTGKKIHHYTMPWGSGVSICPGRFFALSEVKLFILLMVTHFDLELVDPDT
:.::.: ::.: ::....:.::::.: . : :: .:.. .: :..:...:.::::.. :.
CCDS13 PDGSEKKDFYKDGKRLKNYNMPWGAGHNHCLGRSYAVNSIKQFVFLVLVHLDLELINADV
420 430 440 450 460 470
480 490 500
pF1KE5 PLPHVDPQRWGFGTMQPSHDVRFRYRLHPTE
.:. : .:.::: ::: ::: :::..:
CCDS13 EIPEFDLSRYGFGLMQPEHDVPVRYRIRP
480 490 500
>>CCDS6171.1 CYP7A1 gene_id:1581|Hs108|chr8 (504 aa)
initn: 838 init1: 318 opt: 1087 Z-score: 1339.6 bits: 257.4 E(32554): 2.7e-68
Smith-Waterman score: 1087; 35.5% identity (69.7% similar) in 512 aa overlap (2-497:6-501)
10 20 30 40 50
pF1KE5 MVLWGPVLGALLVVIAGYLCLPGML--RQRRPWEPPLDKGTVPWLGHAMAFRKNMF
..:: ..::. :: .: :.:. ::::..: .:.:: :. : : .
CCDS61 MMTTSLIWG-------IAIAACCCLWLILGIRRRQTGEPPLENGLIPYLGCALQFGANPL
10 20 30 40 50
60 70 80 90 100 110
pF1KE5 EFLKRMRTKHGDVFTVQLGGQYFTFVMDPLSFGPILKDTQRKLDFGQYAKKLVLKVFGYR
:::. . ::: ::: .: :.: :. .:::. .: . .:. .. :.::.:
CCDS61 EFLRANQRKHGHVFTCKLMGKYVHFITNPLSYHKVLCHG-KYFDWKKFHFATSAKAFGHR
60 70 80 90 100 110
120 130 140 150 160 170
pF1KE5 SVQ---GDH-EMIHSASTKHLRGDGLKDLNETMLDSLSFVMLTSKGWSLDASCWHEDSLF
:.. :. : :... : :.: .:..:.:.:...:. .: . . .. : ....
CCDS61 SIDPMDGNTTENINDTFIKTLQGHALNSLTESMMENLQRIMRPPVSSNSKTAAWVTEGMY
120 130 140 150 160 170
180 190 200 210 220
pF1KE5 RFCYYILFTAGYLSLFGYTKDKEQDLLQAGEL--FMEFRKFDLLFPRFVYSLLWPREWLE
::: ..: ::::..:: . .: .: : . .:..:: .:: .: .: : . ..
CCDS61 SFCYRVMFEAGYLTIFGRDLTR-RDTQKAHILNNLDNFKQFDKVFPALVAGL--PIHMFR
180 190 200 210 220
230 240 250 260 270 280
pF1KE5 VGRLQRLFHKML-SVSHS--QEKEGISNWLGNMLQFLRE--QGVPSAMQDKFNFMMLWAS
... : .:. :. : :..:.::. : .. .:: . . . . : ....::::
CCDS61 TAHNAR--EKLAESLRHENLQKRESISE-LISLRMFLNDTLSTFDDLEKAKTHLVVLWAS
230 240 250 260 270 280
290 300 310 320 330 340
pF1KE5 QGNTGPTSFWALLYLLKHPEAIRAVREEATQVLGEARLETK---QSFAFKLGALQHTPVL
:.:: :..::.:. ....:::..:. ::. ..: .: ... . . .. . :. :::
CCDS61 QANTIPATFWSLFQMIRNPEAMKAATEEVKRTLENAGQKVSLEGNPICLSQAELNDLPVL
290 300 310 320 330 340
350 360 370 380 390 400
pF1KE5 DSVVEETLRLRAAPTLLRLVHEDYTLKMSSGQEYLFRHGDILALFPYLSVHMDPDIHPEP
::...:.::: .: .: ..::.::.. .:. : .:. ::.::.: : .:.::.:.:.:
CCDS61 DSIIKESLRLSSASLNIRTAKEDFTLHLEDGS-YNIRKDDIIALYPQL-MHLDPEIYPDP
350 360 370 380 390 400
410 420 430 440 450 460
pF1KE5 TVFKYDRFLNPNGSRKVDFFKTGKKIHHYTMPWGSGVSICPGRFFALSEVKLFILLMVTH
.:::::.:. ::. :. :. .: :...: ::.:::..:::::.::. :.: :..::...
CCDS61 LTFKYDRYLDENGKTKTTFYCNGLKLKYYYMPFGSGATICPGRLFAIHEIKQFLILMLSY
410 420 430 440 450 460
470 480 490 500
pF1KE5 FDLELVDPDTPLPHVDPQRWGFGTMQPSHDVRFRYRLHPTE
:.:::.. .. : .: .: :.: . : .:..:.:..
CCDS61 FELELIEGQAKCPPLDQSRAGLGILPPLNDIEFKYKFKHL
470 480 490 500
>>CCDS6180.1 CYP7B1 gene_id:9420|Hs108|chr8 (506 aa)
initn: 750 init1: 249 opt: 1006 Z-score: 1239.6 bits: 238.9 E(32554): 1e-62
Smith-Waterman score: 1006; 36.1% identity (66.9% similar) in 504 aa overlap (3-497:19-504)
10 20 30 40
pF1KE5 MVLWGPVLGALLVVIAGYLCLPGMLRQRRPWEPPLDKGTVPWLG
: : .:.: :...: ::: . : ::: :::: :: .:.::
CCDS61 MAGEVSAATGRFSLERLGLPGLALAAALLLLA--LCLL-VRRTRRPGEPPLIKGWLPYLG
10 20 30 40 50
50 60 70 80 90 100
pF1KE5 HAMAFRKNMFEFLKRMRTKHGDVFTVQLGGQYFTFVMDPLSFGPILKDTQRKLDFGQYAK
.. .::. ..:.: .. .:::.::: :::.:.::..::... ..:. ...:.: ...
CCDS61 VVLNLRKDPLRFMKTLQKQHGDTFTVLLGGKYITFILDPFQYQLVIKN-HKQLSFRVFSN
60 70 80 90 100 110
110 120 130 140 150 160
pF1KE5 KLVLKVFGYRSVQGDHEM---IHSASTKHLRGDGLKDLNETMLDSLSFVMLTSKGWSLDA
::. :.:. ..: .:.: .: . :.: .: : :.:...:. :. . : .
CCDS61 KLLEKAFSISQLQKNHDMNDELH-LCYQFLQGKSLDILLESMMQNLKQVF---EPQLLKT
120 130 140 150 160 170
170 180 190 200 210 220
pF1KE5 SCWHEDSLFRFCYYILFTAGYLSLFGYTKDKEQDLLQAGELFMEFRKFDLLFPRFVYSLL
. : :. :: :.: . ...: . ... . .:: .: ::: : .: ..
CCDS61 TSWDTAELYPFCSSIIFEITFTTIYGKVIVCDNNKF-ISELRDDFLKFDDKFAYLVSNI-
180 190 200 210 220 230
230 240 250 260 270
pF1KE5 WPREWLEVGRLQRLFHKMLSVSHSQEKEGISNW---LGNMLQFLREQGVPSAMQ-DKFNF
: : : : .. . .:... :.. ...: . . . :.. : .. ..
CCDS61 -PIELL--GNVKSIREKIIKCFSSEKLAKMQGWSEVFQSRQDVLEKYYVHEDLEIGAHHL
240 250 260 270 280
280 290 300 310 320 330
pF1KE5 MMLWASQGNTGPTSFWALLYLLKHPEAIRAVREEATQVLGEARLETKQSFAFKLGALQHT
.:::: .:: :: :::. :::.::::. :::.: ..: . . ..: ..: :
CCDS61 GFLWASVANTIPTMFWAMYYLLRHPEAMAAVRDEIDRLLQSTGQKKGSGFPIHLTREQLD
290 300 310 320 330 340
340 350 360 370 380 390
pF1KE5 PV--LDSVVEETLRLRAAPTLLRLVHEDYTLKMSSGQEYLFRHGDILALFPYLSVHMDPD
. :.: . :.::: . : .:.:.:: ::. .: .: :.::..:.:: . .: ::.
CCDS61 SLICLESSIFEALRLSSYSTTIRFVEEDLTLSSETG-DYCVRKGDLVAIFPPV-LHGDPE
350 360 370 380 390 400
400 410 420 430 440 450
pF1KE5 IHPEPTVFKYDRFLNPNGSRKVDFFKTGKKIHHYTMPWGSGVSICPGRFFALSEVKLFIL
: : :.::::.. .:..:. ::: :::.. : ::.:.:.: :::::::: :.: ...
CCDS61 IFEAPEEFRYDRFIE-DGKKKTTFFKRGKKLKCYLMPFGTGTSKCPGRFFALMEIKQLLV
410 420 430 440 450 460
460 470 480 490 500
pF1KE5 LMVTHFDLELVDPDTPLPHVDPQRWGFGTMQPSHDVRFRYRLHPTE
...:.::::..: : :. .. .: :: . :. :: :::..
CCDS61 ILLTYFDLEIID-DKPIG-LNYSRLLFGIQYPDSDVLFRYKVKS
470 480 490 500
>>CCDS4916.1 CYP39A1 gene_id:51302|Hs108|chr6 (469 aa)
initn: 428 init1: 151 opt: 340 Z-score: 417.6 bits: 86.7 E(32554): 6.1e-17
Smith-Waterman score: 519; 26.5% identity (58.0% similar) in 498 aa overlap (7-496:3-466)
10 20 30 40 50 60
pF1KE5 MVLWGPVLGALLVVIAGYLCLPGMLRQRRPWEPPLDKGTVPWLGHAMAFRKNMFEFLKRM
... ...: : : : .:... .:: :: .::.: .. : : .::...
CCDS49 MELISPTVIIILGCLALFLLLQRKNLRRPPCIKGWIPWIGVGFEFGKAPLEFIEKA
10 20 30 40 50
70 80 90 100 110
pF1KE5 RTKHGDVFTVQLGGQYFTFVMDPLSFGPILKDTQRKLDFGQYAKKLVLKVFGY-RSV-QG
: :.: .::: :. .::: . ... .:: ..:.:: ....: .. . ..: .
CCDS49 RIKYGPIFTVFAMGNRMTFVTEEEGINVFLK--SKKVDFELAVQNIVYRTASIPKNVFLA
60 70 80 90 100 110
120 130 140 150 160 170
pF1KE5 DHEMIHSASTKHLRGDGLKDLNETMLDSLSFVM--LTSKGWSLDASCWHEDSLFRFCYYI
:: .. .. .:.... . . : . : ..: ..: . . :. .
CCDS49 LHEKLYIMLKGKMGTVNLHQFTGQLTEELHEQLENLGTHG-TMDLNNLVRHLLYPVTVNM
120 130 140 150 160 170
180 190 200 210 220 230
pF1KE5 LFTAGYLSLFGYTKDKEQDLLQAGELFMEFRKFDLLFPRFVYSLLWPREWLEVGR-LQRL
::. :::. .: : ... : ... : .. .:. :: :.: . . . .:
CCDS49 LFNK---SLFSTNKKKIKEFHQYFQVYDEDFEYGSQLPE---CLL--RNWSKSKKWFLEL
180 190 200 210 220
240 250 260 270 280 290
pF1KE5 FHKML-SVSHSQEKEGISNWLGNMLQFLREQGVPSAMQDKFNFMMLWASQGNTGPTSFWA
:.: . ... . . : : . . : . . . ......:::: .:. :..::.
CCDS49 FEKNIPDIKACKSAKDNSMTLLQATLDIVETETSKENSPNYGLLLLWASLSNAVPVAFWT
230 240 250 260 270 280
300 310 320 330 340 350
pF1KE5 LLYLLKHPEAIRAVREEATQVLGEARLETKQSFAFKLGALQHTPVLDSVVEETLRLRAAP
: :.:.::. .:. : ..:.:.: :... . :.. .. : ::.::.:
CCDS49 LAYVLSHPDIHKAIMEGISSVFGKA---GKDKIKVSEDDLENLLLIKWCVLETIRLKAPG
290 300 310 320 330 340
360 370 380 390 400 410
pF1KE5 TLLRLVHEDYTLKMSSGQEYLFRHGDILALFPYLSVHMDPDIHPEPTVFKYDRFLNPNGS
.. : : .: .:.. ::.: : :. .: .: ::: .:: .:. . :
CCDS49 VITRKV-----VKPVEILNYIIPSGDLLMLSPFW-LHRNPKYFPEPELFKPERWKKANLE
350 360 370 380 390
420 430 440 450 460 470
pF1KE5 RK--VDFFKTGKKIHHYTMPWGSGVSICPGRFFALSEVKLFILLMVTHFDLELVDPDTPL
.. .: : : .::: ::.:.::: ::.. :.:.. ..: :.:: :
CCDS49 KHSFLDCF----------MAFGSGKFQCPARWFALLEVQMCIILILYKYDCSLLDP---L
400 410 420 430 440
480 490 500
pF1KE5 PHVDPQRWGFGTMQPSHDVRFRYRLHPTE
:. . . :. :: . :..:.
CCDS49 PKQSYLHL-VGVPQPEGQCRIEYKQRI
450 460
501 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Tue Nov 8 05:53:08 2016 done: Tue Nov 8 05:53:09 2016
Total Scan time: 3.160 Total Display time: 0.030
Function used was FASTA [36.3.4 Apr, 2011]